Selamat Datang Di Kelas AI (Beta)

Membuka File Excel & CSV Dengan Pandas

Tim Kelas AI - 01 Jan 2025

Tim Kelas AI, 01 Jan 2025
3 Minute Read

Kita juga bisa membuka file dalam bentuk excel dan csv dengan menggunakan pandas, sehingga hasilnya dapat diolah dalam bentuk dataframe. Kita akan membahasnya pada modul ini.

Membuka File Excel

Pertama-tama, siapkan dulu file excel yang ingin kita buka dengan pandas. Tenang, kami punya banyak file nya. Kalian bisa mencarinya pada dataset Kelas AI disini.

Sekarang kita akan mencoba membuka file 'insurance_economy.xlsx' dari dataset Kelas AI yang bisa kalian download dengan cara berikut:

!wget --no-check-certificate \
    https://cdn.kelasai.id/insurance_economy.xlsx
Output:
--2024-12-24 14:50:53-- https://cdn.kelasai.id/insurance_economy.xlsx Resolving cdn.kelasai.id (cdn.kelasai.id)... 154.41.240.165, 2a02:4780:6:1252:0:2588:d4de:4 Connecting to cdn.kelasai.id (cdn.kelasai.id)|154.41.240.165|:443... connected. HTTP request sent, awaiting response... 200 OK Length: 17827 (17K) [text/plain] Saving to: 'insurance_economy.xlsx' insurance_economy.x 100%[===================>] 17.41K 76.1KB/s in 0.2s 2024-12-24 14:50:54 (76.1 KB/s) - 'insurance_economy.xlsx' saved [17827/17827]

Untuk membuka dataset excel, kalian bisa menggunakan method read_excel() dari pandas seperti berikut:

df = pd.read_excel('insurance_economy.xlsx')
df
year life_insurance_premi non_life_insurance_premi insurance_premi private_consumption gov_expenditure investment trade inflation gdp
0 1996 0.505871 0.644390 1.150261 62.36 7.566959 31.60 52.264744 8.676510 2.273697e+11
1 1997 0.560647 0.610687 1.171334 61.68 6.842805 30.31 55.993859 12.571376 2.157490e+11
2 1998 0.480243 0.666057 1.146300 67.78 5.693508 27.43 96.186192 75.271169 9.544555e+10
3 1999 0.464260 0.554159 1.018419 73.94 6.604457 22.14 62.943913 14.161196 1.400014e+11
4 2000 0.492913 0.499936 0.992849 61.65 6.531995 22.25 71.436876 20.447457 1.650210e+11
... ... ... ... ... ... ... ... ... ... ...
67 2015 7.493890 4.955460 12.449350 48.54 15.083530 29.53 79.132494 3.185596 1.465773e+12
68 2016 7.317070 4.997940 12.315010 47.96 15.240022 30.14 73.603809 1.986039 1.500112e+12
69 2017 6.528480 4.905200 11.433680 47.55 15.418972 32.29 77.120918 2.222781 1.623901e+12
70 2018 6.120000 5.050000 11.170000 47.97 16.134855 31.31 78.660262 0.471115 1.720579e+12
71 2019 5.840000 4.950000 10.790000 48.58 17.255976 31.20 76.709395 -0.933287 1.642383e+12

Membuka File CSV

Pertama, kita membutuhkan sebuah dataset untuk eksperimen ini. Kita akan coba mendownload dataset 'gdp_vs_life_expectancy.csv' dari Dataset Kelas AI dengan cara berikut:

!wget --no-check-certificate \
    https://cdn.kelasai.id/gdp_vs_life_expectancy.csv
Output:
--2024-12-25 09:44:29-- https://cdn.kelasai.id/gdp_vs_life_expectancy.csv Resolving cdn.kelasai.id (cdn.kelasai.id)... 154.41.240.165, 2a02:4780:6:1252:0:2588:d4de:4 Connecting to cdn.kelasai.id (cdn.kelasai.id)|154.41.240.165|:443... connected. HTTP request sent, awaiting response... 200 OK Length: 2099135 (2.0M) [text/plain] Saving to: 'gdp_vs_life_expectancy.csv' gdp_vs_life_expecta 100%[===================>] 2.00M 1.10MB/s in 1.8s 2024-12-25 09:44:32 (1.10 MB/s) - 'gdp_vs_life_expectancy.csv' saved [2099135/2099135]

Untuk membuka dataset excel, kalian bisa menggunakan method read_csv() dari pandas seperti berikut:

import pandas as pd

df = pd.read_csv('gdp_vs_life_expectancy.csv')
df
Entity Code Year Life expectancy at birth (historical) GDP per capita 417485-annotations Population (historical estimates) Continent
0 Abkhazia OWID_ABK 2015 NaN NaN NaN NaN Asia
1 Afghanistan AFG 1950 27.7 1156.0 NaN 7480464.0 NaN
2 Afghanistan AFG 1951 28.0 1170.0 NaN 7571542.0 NaN
3 Afghanistan AFG 1952 28.4 1189.0 NaN 7667534.0 NaN
4 Afghanistan AFG 1953 28.9 1240.0 NaN 7764549.0 NaN
... ... ... ... ... ... ... ... ...
62151 Zimbabwe ZWE 1946 NaN NaN NaN 2526552.0 NaN
62152 Zimbabwe ZWE 1947 NaN NaN NaN 2575037.0 NaN
62153 Zimbabwe ZWE 1948 NaN NaN NaN 2624453.0 NaN
62154 Zimbabwe ZWE 1949 NaN NaN NaN 2681604.0 NaN
62155 Ã…land Islands ALA 2015 NaN NaN NaN NaN Europe

Jika tampilan diatas muncul, maka kalian berhasil melakukannya.

Baca Juga:

Artikel yang mungkin relate buat kamu

001

Pandas (Python for Data Science) adalah sebuah library atau package pada bahasa pemrograman Python yang memungkinkan kita untuk membuat, mengolah, dan mengelola data dalam bentuk ...

002

Ada kalanya kita hanya ingin menggunakan data pada lokasi tertentu saja dalam sebuah dataframe. Misal dari keseluruhan data, kita hanya ingin mengambil data pada kolom ...


Baca Artikel Lainnya +