1. Ho Minh

    Ho Minh Thành viên mới

    Pandas! Một thư viện xử lý dữ liệu tuyệt vời cho các data scientist

    Hôm nay tôi sẽ giới thiệu với các bạn về pandas, một thư viện xử lý dữ liệu rất mạnh trên Python, đặc biệt trong ngành khoa học dữ liệu. Điều đặc biệt ở pandas là nó là một tập hợp của rất nhiều các thư viện con ẩn trong nó, vì vậy pandas cung cấp rất nhiều tính năng hữu ích cho người sử dụng.

    Pandas lưu trữ dữ liệu theo một cách khá giống với Excel, đó là sử dụng các bảng hay còn được gọi là DataFrame. Bắt đầu sử dụng pandas với câu lệnh:

    [​IMG]
    Những chức năng cơ bản
    Đọc dữ liệu từ file csv:

    [​IMG]
    Pandas cung cấp các option trong việc đọc file csv như:

    [​IMG]
    với

    • sep: dấu phân cách giữa các điểm dữ liệu trên 1 dòng
    • encoding: định dạng của file dữ liệu
    • nrows: số lượng hàng sẽ đọc
    • skiprows: những hàng sẽ bỏ qua khi đọc dữ liệu
    Ngoài ra còn một số hàm để đọc dữ liệu như: read_excel(), read_clipboard(), read_sql()

    Ghi dữ liệu

    [​IMG]
    Rất đơn giản phải không. Ngoài ra còn một số hàm để ghi dữ liệu như: to_excel(), to_json(), to_pickle().

    Xem các số liệu về dữ liệu

    Xem số chiều của dữ liệu:

    [​IMG]
    Xem các thống kê về dữ liệu:

    [​IMG]
    Xem thêm: tại ereka.vn/post/pandas-mot-thu-vien-xu-ly-du-lieu-tuyet-voi-cho-cac-data-scientist-52982777238553895
     


    Nguyen Le Phuong Lan thích điều này.


  2. Nguyen Le Phuong Lan

    Nguyen Le Phuong Lan Thành viên mới

    Tham gia:
    16/11/2018
    Bài viết:
    2
    Lượt thích:
    7
    Kinh nghiệm:
    3
    :KSV@07:chủ đề hay đó bạn
     
    Ho Minh thích điều này.

Chia sẻ cùng bạn bè

Đang tải...
TOP