Hôm nay tôi sẽ giới thiệu với các bạn về pandas, một thư viện xử lý dữ liệu rất mạnh trên Python, đặc biệt trong ngành khoa học dữ liệu. Điều đặc biệt ở pandas là nó là một tập hợp của rất nhiều các thư viện con ẩn trong nó, vì vậy pandas cung cấp rất nhiều tính năng hữu ích cho người sử dụng.
Pandas lưu trữ dữ liệu theo một cách khá giống với Excel, đó là sử dụng các bảng hay còn được gọi là DataFrame. Bắt đầu sử dụng pandas với câu lệnh:
Những chức năng cơ bản
Đọc dữ liệu từ file csv:
Pandas cung cấp các option trong việc đọc file csv như:
với
Ghi dữ liệu
Rất đơn giản phải không. Ngoài ra còn một số hàm để ghi dữ liệu như: to_excel(), to_json(), to_pickle().
Xem các số liệu về dữ liệu
Xem số chiều của dữ liệu:
Xem các thống kê về dữ liệu:
Xem thêm: tại ereka.vn/post/pandas-mot-thu-vien-xu-ly-du-lieu-tuyet-voi-cho-cac-data-scientist-52982777238553895
Pandas lưu trữ dữ liệu theo một cách khá giống với Excel, đó là sử dụng các bảng hay còn được gọi là DataFrame. Bắt đầu sử dụng pandas với câu lệnh:
Những chức năng cơ bản
Đọc dữ liệu từ file csv:
Pandas cung cấp các option trong việc đọc file csv như:
với
- sep: dấu phân cách giữa các điểm dữ liệu trên 1 dòng
- encoding: định dạng của file dữ liệu
- nrows: số lượng hàng sẽ đọc
- skiprows: những hàng sẽ bỏ qua khi đọc dữ liệu
Ghi dữ liệu
Rất đơn giản phải không. Ngoài ra còn một số hàm để ghi dữ liệu như: to_excel(), to_json(), to_pickle().
Xem các số liệu về dữ liệu
Xem số chiều của dữ liệu:
Xem các thống kê về dữ liệu:
Xem thêm: tại ereka.vn/post/pandas-mot-thu-vien-xu-ly-du-lieu-tuyet-voi-cho-cac-data-scientist-52982777238553895
Hiệu chỉnh: