大數據研發工程師
8000-11000元/月崗位職責:
1、負責公司數據倉庫、數據湖及實時數據處理體系的架構設計與系統搭建。根據業務需求與數據特性,選擇合適的存儲技術與解決方案,保障數據的高效存取與管理,并持續進行架構調優,以應對數據規模擴展與業務演進,確保系統的穩定性與可伸縮性。
2、制定并實施多源數據采集方案,整合來自數據庫、文件系統等不同渠道的數據資源。運用ETL工具完成數據的清洗、轉換與集成,構建自動化數據處理流程,實現數據的定時更新,為數據分析、挖掘及各類應用提供可靠、高質量的數據支持。
3、結合業務場景與分析目標,設計適用于數據倉庫(如星型、雪花模型)以及機器學習和數據挖掘任務的特征模型。使用SQL、Java等語言實現數據查詢、統計計算及算法邏輯,支撐數據探索、報表輸出與模型訓練需求。
4、建立完善的數據質量管理體系,設定監控指標與評估機制。借助技術手段對數據異常(如缺失、重復等)進行實時預警與處理。協同數據來源部門與業務團隊,優化數據采集流程與規范,持續提升整體數據質量水平。
5、制定并落實數據權限管控策略,嚴格遵循相關法律法規,確保數據使用的合法性與存儲的合規性。對敏感信息實施加密與脫敏處理,防范數據泄露風險,保障數據資產安全。
任職要求:
1、計算機、軟件工程、數學、統計學、數據科學等相關專業本科及以上學歷。
2、熟練掌握至少一種ETL工具(如Informatica、Talend、Kettle),能夠獨立完成數據抽取、轉換與加載工作。精通SQL,具備編寫復雜查詢及數據庫性能調優的能力,熟悉主流關系型數據庫(如Oracle、MySQL、SQL Server)。掌握Java等數據處理編程語言,可用于數據清洗、分析及算法開發。
3、理解數據倉庫與數據湖的架構原理,熟悉常用數據建模方法,具備設計合理數據模型的能力。了解分布式存儲與計算技術(如Hadoop、Spark、Hive、HBase),能搭建并維護分布式數據環境,具有數據架構設計與優化經驗。
4、熟悉數據質量管理流程,能夠識別并解決常見數據質量問題。了解數據安全與合規要求,掌握數據加密、脫敏及訪問控制技術,能夠有效保障數據的安全性與合規性。
5、具備Linux系統操作能力,可在該環境下開展數據處理與系統運維工作。熟悉常用的數據分析與可視化工具。
6、學習與創新能力突出,能快速吸收新技術與工具。具備較強的邏輯思維與問題解決能力,可獨立應對復雜的數據處理挑戰。擁有良好的團隊協作意識與溝通能力,能與多部門高效配合。
7、具有3年以上數據開發工作經驗,有完整參與過數據倉庫或大數據項目者優先,具備大規模、實時數據處理實踐經驗者更佳。