Membuka File Excel & CSV Dengan Pandas
Kita juga bisa membuka file dalam bentuk excel dan csv dengan menggunakan pandas, sehingga hasilnya dapat diolah dalam bentuk dataframe. Kita akan membahasnya pada modul ini.
Membuka File Excel
Pertama-tama, siapkan dulu file excel yang ingin kita buka dengan pandas. Tenang, kami punya banyak file nya. Kalian bisa mencarinya pada dataset Kelas AI disini.
Sekarang kita akan mencoba membuka file 'insurance_economy.xlsx' dari dataset Kelas AI yang bisa kalian download dengan cara berikut:
!wget --no-check-certificate \
https://cdn.kelasai.id/insurance_economy.xlsx
Output:
--2024-12-24 14:50:53-- https://cdn.kelasai.id/insurance_economy.xlsx Resolving cdn.kelasai.id (cdn.kelasai.id)... 154.41.240.165, 2a02:4780:6:1252:0:2588:d4de:4 Connecting to cdn.kelasai.id (cdn.kelasai.id)|154.41.240.165|:443... connected. HTTP request sent, awaiting response... 200 OK Length: 17827 (17K) [text/plain] Saving to: 'insurance_economy.xlsx' insurance_economy.x 100%[===================>] 17.41K 76.1KB/s in 0.2s 2024-12-24 14:50:54 (76.1 KB/s) - 'insurance_economy.xlsx' saved [17827/17827]
Untuk membuka dataset excel, kalian bisa menggunakan method read_excel()
dari pandas seperti berikut:
df = pd.read_excel('insurance_economy.xlsx')
df
year | life_insurance_premi | non_life_insurance_premi | insurance_premi | private_consumption | gov_expenditure | investment | trade | inflation | gdp | |
0 | 1996 | 0.505871 | 0.644390 | 1.150261 | 62.36 | 7.566959 | 31.60 | 52.264744 | 8.676510 | 2.273697e+11 |
1 | 1997 | 0.560647 | 0.610687 | 1.171334 | 61.68 | 6.842805 | 30.31 | 55.993859 | 12.571376 | 2.157490e+11 |
2 | 1998 | 0.480243 | 0.666057 | 1.146300 | 67.78 | 5.693508 | 27.43 | 96.186192 | 75.271169 | 9.544555e+10 |
3 | 1999 | 0.464260 | 0.554159 | 1.018419 | 73.94 | 6.604457 | 22.14 | 62.943913 | 14.161196 | 1.400014e+11 |
4 | 2000 | 0.492913 | 0.499936 | 0.992849 | 61.65 | 6.531995 | 22.25 | 71.436876 | 20.447457 | 1.650210e+11 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
67 | 2015 | 7.493890 | 4.955460 | 12.449350 | 48.54 | 15.083530 | 29.53 | 79.132494 | 3.185596 | 1.465773e+12 |
68 | 2016 | 7.317070 | 4.997940 | 12.315010 | 47.96 | 15.240022 | 30.14 | 73.603809 | 1.986039 | 1.500112e+12 |
69 | 2017 | 6.528480 | 4.905200 | 11.433680 | 47.55 | 15.418972 | 32.29 | 77.120918 | 2.222781 | 1.623901e+12 |
70 | 2018 | 6.120000 | 5.050000 | 11.170000 | 47.97 | 16.134855 | 31.31 | 78.660262 | 0.471115 | 1.720579e+12 |
71 | 2019 | 5.840000 | 4.950000 | 10.790000 | 48.58 | 17.255976 | 31.20 | 76.709395 | -0.933287 | 1.642383e+12 |
Membuka File CSV
Pertama, kita membutuhkan sebuah dataset untuk eksperimen ini. Kita akan coba mendownload dataset 'gdp_vs_life_expectancy.csv' dari Dataset Kelas AI dengan cara berikut:
!wget --no-check-certificate \
https://cdn.kelasai.id/gdp_vs_life_expectancy.csv
Output:
--2024-12-25 09:44:29-- https://cdn.kelasai.id/gdp_vs_life_expectancy.csv Resolving cdn.kelasai.id (cdn.kelasai.id)... 154.41.240.165, 2a02:4780:6:1252:0:2588:d4de:4 Connecting to cdn.kelasai.id (cdn.kelasai.id)|154.41.240.165|:443... connected. HTTP request sent, awaiting response... 200 OK Length: 2099135 (2.0M) [text/plain] Saving to: 'gdp_vs_life_expectancy.csv' gdp_vs_life_expecta 100%[===================>] 2.00M 1.10MB/s in 1.8s 2024-12-25 09:44:32 (1.10 MB/s) - 'gdp_vs_life_expectancy.csv' saved [2099135/2099135]
Untuk membuka dataset excel, kalian bisa menggunakan method read_csv()
dari pandas seperti berikut:
import pandas as pd
df = pd.read_csv('gdp_vs_life_expectancy.csv')
df
Entity | Code | Year | Life expectancy at birth (historical) | GDP per capita | 417485-annotations | Population (historical estimates) | Continent | |
0 | Abkhazia | OWID_ABK | 2015 | NaN | NaN | NaN | NaN | Asia |
1 | Afghanistan | AFG | 1950 | 27.7 | 1156.0 | NaN | 7480464.0 | NaN |
2 | Afghanistan | AFG | 1951 | 28.0 | 1170.0 | NaN | 7571542.0 | NaN |
3 | Afghanistan | AFG | 1952 | 28.4 | 1189.0 | NaN | 7667534.0 | NaN |
4 | Afghanistan | AFG | 1953 | 28.9 | 1240.0 | NaN | 7764549.0 | NaN |
... | ... | ... | ... | ... | ... | ... | ... | ... |
62151 | Zimbabwe | ZWE | 1946 | NaN | NaN | NaN | 2526552.0 | NaN |
62152 | Zimbabwe | ZWE | 1947 | NaN | NaN | NaN | 2575037.0 | NaN |
62153 | Zimbabwe | ZWE | 1948 | NaN | NaN | NaN | 2624453.0 | NaN |
62154 | Zimbabwe | ZWE | 1949 | NaN | NaN | NaN | 2681604.0 | NaN |
62155 | ÃÆÃââââ¬Ã¦land Islands | ALA | 2015 | NaN | NaN | NaN | NaN | Europe |
Jika tampilan diatas muncul, maka kalian berhasil melakukannya.
Baca Juga:
Artikel yang mungkin relate buat kamu
Pandas (Python for Data Science) adalah sebuah library atau package pada bahasa pemrograman Python yang memungkinkan kita untuk membuat, mengolah, dan mengelola data dalam bentuk ...
Ada kalanya kita hanya ingin menggunakan data pada lokasi tertentu saja dalam sebuah dataframe. Misal dari keseluruhan data, kita hanya ingin mengambil data pada kolom ...