Selamat Datang Di Kelas AI (Beta)

Dataset Diagnosis & Prediksi Diabetes

John & Paul - 28 May 2025

arrow_back Numeric Healthcare

Diabetes merupakan salah satu penyakit kronis yang banyak diderita di seluruh dunia. Deteksi dini terhadap risiko diabetes sangat penting agar penanganan dapat dilakukan sedini mungkin. Dengan berkembangnya teknologi dan ketersediaan data medis, machine learning dapat dimanfaatkan untuk membangun model prediktif yang dapat membantu tenaga medis dalam proses deteksi awal diabetes secara otomatis dan akurat.

Dataset ini adalah dataset diagnosis, deteksi dan prediksi diabetes yang berasal dari National Institute of Diabetes and Digestive and Kidney Diseases. Tujuannya adalah memprediksi apakah seorang pasien memiliki diabetes berdasarkan data medis. Studi ini dilakukan pada sekelompok perempuan keturunan Pima Indian, yang berusia 21 tahun ke atas dan bertempat tinggal di Arizona, Amerika Serikat.

Acknowledment

Smith, J.W., Everhart, J.E., Dickson, W.C., Knowler, W.C., & Johannes, R.S. (1988). Using the ADAP learning algorithm to forecast the onset of diabetes mellitus. In Proceedings of the Symposium on Computer Applications and Medical Care (pp. 261--265). IEEE Computer Society Press.

Keterangan

Nama Kolom Keterangan
Pregnancies Jumlah kehamilan yang pernah dialami
Glucose Kadar glukosa dalam plasma
BloodPressure Tekanan darah diastolik (mm Hg)
SkinThickness Ketebalan lipatan kulit triceps (mm)
Insulin Kadar insulin serum (mu U/ml)
BMI Body Mass Index
DiabetesPedigreeFunction Fungsi silsilah diabetes
Age Usia (dalam tahun)
Outcome Label (1 = diabetes, 0 = tidak diabetes)

Penggunaan

Ada dua cara untuk menggunakan dataset ini, pertama kalian bisa melakukan penarikan langsung (fork) dari CDN Kelas AI di proyek google colab kalian seperti ini:

Dataset Dataset Diabetes :

!wget --no-check-certificate \
    https://cdn.kelasai.id/dataset_diabetes.csv
import pandas as pd

df = pd.read_csv('dataset_diabetes.csv')
df

Download

Atau kalian juga dapat mendownloadanya secara lokal disini: