Apa itu Data Analyst?

     Source: jagoanhosting.com

Apa Itu Data?

Data adalah sekumpulan keterangan ataupun fakta yang dibuat dengan kata-kata, kalimat, simbol, angka, dan lainnya. Data disini didapatkan melalui sebuah proses pencarian dan juga pengamatan yang tepat berdasarkan sumber-sumber tertentu. Adapun pengertian lain dari data yaitu sebagai suatu kumpulan keterangan atau deskripsi dasar yang berasal dari obyek ataupun kejadian.

Apa Itu Data Analyst?

Data analyst adalah suatu profesi yang bertanggung jawab untuk mengolah data menggunakan sejumlah tools dan menerjemahkannya ke dalam bentuk informasi yang mudah dipahami oleh semua orang. Banyak orang yang mengira bahwa data analyst adalah ‘tukang data’ yang tentu membuat pekerjaan ini terlihat sekedar pengolahan data sederhana.


Apa Itu Big Data?

Big data adalah kumpulan data yang sangat besar, kompleks dan terus bertambah setiap waktu. Data ini dihasilkan dari aktivitas internet yang makin rutin dilakukan, baik untuk tujuan pribadi maupun bisnis.

Sebagai contoh, awalnya informasi penting dari Anda mungkin berupa data nama, alamat dan nomor telepon.

Namun saat ini, data yang Anda miliki makin beragam, termasuk postingan di media sosial, riwayat belanja di marketplace, hingga pencarian di mesin pencari yang menunjukkan ketertarikan Anda tentang suatu topik.

Semua data tersebut terus dihasilkan bersamaan dengan data dari pengguna lain di seluruh dunia. Bahkan, pengguna internet menghasilkan data sekitar
2,5 quintillion bytes setiap hari!


Apa Itu Pandas Data Frame?

DataFrame adalah struktur data 2 dimensi yang berbentuk tabular (mempunyai baris dan kolom)

Hampir semua data tidak hanya memiliki 1 kolom tetapi lebih sehingga lebih cocok menggunakan pandas DataFrame untuk mengolahnya

DataFrame dapat dibuat lebih dari satu Series atau dapat kita katakan bahwa DataFrame adalah kumpulan Series

Visualisasi Data Pada Bahasa Python

Matplotlib

Deskripsi: Matplotlib adalah salah satu library visualisasi data paling populer dan serbaguna di Python. Library ini memungkinkan pengguna untuk membuat berbagai jenis grafik, termasuk line plot, bar plot, scatter plot, histogram, dan banyak lagi.
Kelebihan: Sangat fleksibel dan dapat dikustomisasi secara mendetail. Sangat baik untuk membuat plot yang membutuhkan banyak penyesuaian.


Seaborn

Deskripsi: Seaborn dibangun di atas Matplotlib dan menyediakan antarmuka tingkat tinggi untuk membuat grafik statistik yang menarik dan informatif. Library ini sangat berguna untuk visualisasi yang melibatkan data kategori dan relasional.

Kelebihan: Mudah digunakan dan menghasilkan plot yang estetis secara default. Sangat baik untuk analisis data statistik.

Plotly

Deskripsi: Plotly adalah library untuk membuat visualisasi interaktif yang dapat digunakan di web. Library ini memungkinkan pengguna untuk membuat plot yang dapat berinteraksi dengan pengguna, seperti zoom, hover, dan klik.
Kelebihan: Interaktif dan dapat digunakan di aplikasi web. Dukungan untuk berbagai jenis grafik yang kompleks.
Contoh Penggunaan:

Bokeh

Deskripsi: Bokeh adalah library untuk membuat visualisasi data interaktif dan dinamis. Library ini memungkinkan pengguna untuk membuat plot yang dapat digunakan di aplikasi web dan dashboard.

Kelebihan: Fokus pada interaktivitas dan dapat diintegrasikan dengan mudah dalam aplikasi web.
Contoh Penggunaan:


Geeks for Geeks

Sumber daya online yang menyediakan tutorial dan contoh visualisasi data dengan berbagai library Python.
Mencakup tutorial untuk Matplotlib, Seaborn, Plotly, dan Bokeh.
Cocok untuk pemula dan pengguna yang ingin mempelajari library visualisasi data baru.


Pemilihan library terbaik tergantung pada kebutuhan dan preferensi:
Matplotlib: Cocok untuk pemula dan tugas visualisasi data dasar.
Seaborn: Cocok untuk analisis data statistik dan pembuatan laporan.

Apa Itu Machine Learning?

Teknologi machine learning (ML) adalah mesin yang dikembangkan untuk bisa belajar dengan sendirinya tanpa arahan dari penggunanya. Pembelajaran mesin dikembangkan berdasarkan disiplin ilmu lainnya seperti statistika, matematika dan data mining sehingga mesin dapat belajar dengan menganalisa data tanpa perlu di program ulang atau diperintah.

Dalam hal ini machine learning memiliki kemampuan untuk memperoleh data yang ada dengan perintah ia sendiri. ML juga dapat mempelajari data yang ada dan data yang ia peroleh sehingga bisa melakukan tugas tertentu. Tugas yang dapat dilakukan oleh ML pun sangat beragam, tergantung dari apa yang ia pelajari.

Pengertian Outlier

Secara umum, outlier atau pencilan adalah objek data yang menyimpang secara signifikan dari objek lainnya dalam suatu kelompok data. Arti lain dapat dilihat dari Outlier (Pencilan) yang bersumber dari kata pencil yang bermakna terasing (terpisah) dari yang lain.

Cross Validation Sampling

Cross validation adalah teknik statistik yang digunakan dalam machine learning dan pemodelan prediktif lainnya untuk menilai kinerja dan kemampuan generalisasi suatu model.

Hyperparameter Tuning

Model matematika yang berisi sejumlah parameter yang harus dipelajari dari data disebut sebagai model machine learning. Kamu dapat menyesuaikan parameter model dengan melatih model menggunakan data yang ada. Namun, ada jenis parameter lain yang dikenal sebagai hyperparameter, yang merupakan jenis parameter yang tidak dapat dipelajari langsung dari prosedur pelatihan standar.

Mereka biasanya ditangani sebelum dimulainya prosedur pelatihan. Parameter ini menggambarkan aspek penting dari model, seperti kompleksitas dan kecepatan belajar. Hyperparameter tuning adalah penambah model otomatis yang disediakan oleh AI Platform Training.

Pada hyperparameter tuning memanfaatkan infrastruktur pemrosesan Google Cloud untuk menguji konfigurasi hyperparameter yang berbeda saat melatih modelmu. Ini dapat memberi nilai yang dioptimalkan untuk hyperparameter, yang memaksimalkan akurasi prediksi modelmu.









Sumber:
https://www.gramedia.com/literasi/pengertian-data/
https://www.jagoanhosting.com/blog/data-analyst-adalah/
https://www.niagahoster.co.id/blog/big-data-adalah/
https://ngodingdata.com/python-pandas-dataframe/
https://chatgpt.com
https://inveritasoft.com/article-top-python-libraries-for-data-visualization
https://www.dicoding.com/blog/machine-learning-adalah/
https://jagostat.com/machine-learning/memahami-outlier-dalam-data-statistik
https://codingstudio.id/blog/hyperparameter-tuning/

Komentar

Postingan populer dari blog ini

Tugas Modul 4, 5, 7, 8

Mini Project Dengan JS by Mikel ibrahim

Membuat sistem yang meng generate list sesuai input yang di masukkan menggunakan JavaScript