- Tham gia
- 19/9/2024
- Bài viết
- 72
Chào anh em, dạo này lướt tin tức tuyển dụng IT hoặc vào các group dân văn phòng, chắc chắn anh em sẽ thấy người ta ra rả nói về ngành Data. Nào là "Làm Data lương nghìn đô", "Kỷ nguyên dữ liệu". Nhưng cứ đụng đến các vị trí thì lại loạn cào cào: Data Analyst (DA), Data Engineer (DE) rồi lại Data Scientist (DS).
Công ty thì tuyển DA nhưng lại bắt làm việc của DE, người đi phỏng vấn DS thì lại chỉ biết dùng mỗi Excel. Rốt cuộc 3 cái chức danh nghe rất Tây và rất "kêu" này khác nhau ở chỗ nào? Hôm nay chúng ta sẽ cùng "giải ngố", bóc tách rõ ràng chức năng của từng vị trí thông qua một ví dụ cực kỳ bình dân: Mở một nhà hàng bán phở.
Và Data Engineer (Kỹ sư dữ liệu) chính là những người Thợ sửa ống nước siêu hạng.
Câu hỏi dự đoán tương lai này vượt quá sức của DA. Đó là lúc vị pháp sư tối cao Data Scientist (Nhà khoa học dữ liệu) bước ra.
Tìm hiểu thêm: Lộ trình học Data engineer nè
#GiaiNgoData #DataAnalyst #DataScientist #DataEngineer
Công ty thì tuyển DA nhưng lại bắt làm việc của DE, người đi phỏng vấn DS thì lại chỉ biết dùng mỗi Excel. Rốt cuộc 3 cái chức danh nghe rất Tây và rất "kêu" này khác nhau ở chỗ nào? Hôm nay chúng ta sẽ cùng "giải ngố", bóc tách rõ ràng chức năng của từng vị trí thông qua một ví dụ cực kỳ bình dân: Mở một nhà hàng bán phở.
1. Data Engineer (DE) - Người Thợ Săn Nước Và Xây Đường Ống
Hãy tưởng tượng dữ liệu (Data) của công ty chính là những dòng suối nước tự nhiên ở ngoài rừng. Nước này có thể là: lịch sử người dùng nhấp chuột trên website, hóa đơn từ máy tính tiền, hay bình luận chửi rủa của khách hàng trên Facebook. Nước tự nhiên thì rất bẩn, đầy rác và bùn đất.Và Data Engineer (Kỹ sư dữ liệu) chính là những người Thợ sửa ống nước siêu hạng.
- Nhiệm vụ: Anh em DE không quan tâm nước đó dùng để nấu món gì. Nhiệm vụ của họ là xây một cái đập chứa nước khổng lồ (Data Warehouse / Data Lake). Sau đó, họ lắp đặt một hệ thống đường ống chằng chịt, gắn thêm máy bơm và màng lọc (quá trình ETL/ELT) để hút nước từ suối, lọc sạch rác, bùn đất và bơm dòng nước sạch tinh khiết đó vào bể chứa của công ty mỗi ngày.
- Công cụ: Máy khoan, cờ lê của DE chính là các công cụ hạng nặng như SQL, Python, Apache Spark, Kafka, Airflow hay các nền tảng đám mây AWS, Google Cloud. Không có DE xây đường ống, cả công ty sẽ chết khát vì không có dữ liệu sạch để dùng.
2. Data Analyst (DA) - Chuyên Viên Pha Chế Và Đọc Vị Quá Khứ
Nước sạch đã được DE bơm đầy vào bể. Bây giờ là lúc Data Analyst (Chuyên viên Phân tích dữ liệu) xuất hiện. DA đóng vai trò là những Chuyên viên pha chế và quản lý nhà hàng.- Nhiệm vụ: DA sẽ vặn vòi hứng nước sạch từ bể, pha trà đá, luộc bánh phở. Công việc của họ là nhìn vào những gì đã xảy ra trong quá khứ để trả lời các câu hỏi: "Tháng trước chúng ta bán được bao nhiêu bát phở?", "Tại sao doanh thu cơ sở quận 1 lại giảm?", "Khách hàng thường gọi quẩy ăn kèm với phở bò hay phở gà?".Sau khi tìm ra câu trả lời, DA sẽ vẽ lên các bảng báo cáo xanh đỏ tím vàng (Dashboard) cực kỳ đẹp mắt để mang lên báo cáo cho ông Giám đốc xem dễ hiểu nhất.
- Công cụ: Vũ khí của DA nhẹ nhàng hơn một chút. Họ dùng SQL (để vặn vòi nước), dùng Excel (để nhào nặn) và dùng Power BI hay Tableau (để vẽ biểu đồ trang trí).
3. Data Scientist (DS) - Nhà Tiên Tri Và Người Chế Tạo Máy Tự Động
Khi nhà hàng đã có nước sạch để dùng, đã biết tháng trước bán được bao nhiêu bát phở, ông Giám đốc lại nảy sinh một lòng tham lớn hơn: "Liệu tháng sau, ngày mưa bão thì bán được bao nhiêu bát để tôi còn biết đường nhập thịt bò? Làm sao để tự động nhận diện ông khách quen bước vào cửa để tự động lên đơn không cần hỏi?"Câu hỏi dự đoán tương lai này vượt quá sức của DA. Đó là lúc vị pháp sư tối cao Data Scientist (Nhà khoa học dữ liệu) bước ra.
- Nhiệm vụ: DS là Nhà tiên tri. Họ lấy dữ liệu lịch sử từ bể nước, kết hợp với các công thức toán học và xác suất thống kê phức tạp để xây dựng các mô hình Trí tuệ nhân tạo (Machine Learning/AI).DS sẽ dạy cho máy tính tự học để nó trả lời được: "Xác suất tháng sau doanh thu tăng là 80%", hoặc tạo ra hệ thống AI quét camera tự nhận diện khuôn mặt khách quen để gợi ý món ăn.
- Công cụ: DS là sự kết hợp giữa kỹ năng lập trình (Python) và não bộ của một giáo sư Toán học. Họ dùng các thư viện Học máy như Scikit-Learn, TensorFlow, PyTorch để xây dựng các thuật toán dự báo thần sầu.
4. Chốt Lại Thành "Đội Hình Trong Mơ"
Anh em đã thấy rõ sự khác biệt chưa?- Data Engineer (Kỹ sư dữ liệu): Làm việc ở hậu trường, dọn rác, xây đường ống, đảm bảo dòng chảy dữ liệu trơn tru. (Hệ thống).
- Data Analyst (Chuyên viên phân tích): Làm việc với dữ liệu quá khứ, vẽ biểu đồ đẹp mắt để giải thích chuyện gì đã xảy ra. (Kinh doanh).
- Data Scientist (Nhà khoa học dữ liệu): Sử dụng thuật toán AI để dự báo tương lai và tự động hóa quyết định. (Nghiên cứu & Mô hình).
Tìm hiểu thêm: Lộ trình học Data engineer nè
#GiaiNgoData #DataAnalyst #DataScientist #DataEngineer