Ilmu data alias data science merupakan fokus studi yang berhubungan dengan besarnya volume data menggunakan teknik modern demi menemukan pola-pola tak terlihat, mendapat informasi bermakna, serta membuat keputusan bisnis dengan informasi tersebut.
Algoritma pembelajaran mesin yang kompleks digunakan dalam data science untuk membangun model yang prediktif. Adapun, data yang digunakan untuk analisis bisa berasal dari bermacam sumber dan tampak dalam berbagai format.
Data science termasuk topik diskusi yang benar-benar luas dan dengan subjektivitas yang kental. Data science sendiri, menurut definisinya, bukanlah suatu ilmu yang berdiri sendiri. Ia merupakan kombinasi dari berbagai bidang, khususnya matematika, ilmu komputer, strategi bisnis, sampai statistik.
Terdapat tiga komponen yang terlibat dalam data science, yakni organising, packaging, dan delivering data atau The OPD of Data. Untuk organising data sendiri ialah proses penyimpanan data yang kemudian digabungkan dengan manajemen data.
Sementara itu, packaging data adalah proses manipulasi dan penggabungan berbagai data mentah yang nantinya dipresentasikan. Selanjutnya, delivering data merupakan proses memastikan pesan dalam data sudah diakses oleh pihak yang memerlukan.
Dengan adanya peningkatan aliran data yang drastis ini, alat-alat baru yang bisa digunakan untuk memanfaatkan data mentah dengan tepat akan muncul. Cakupan dari data science sendiri ialah alat, teknik, sampai teknologi yang bakal membantu kita menangani meningkatnya aliran data itu sendiri.
Ini adalah perpaduan interdisipliner antara penurunan data, pengembangan algoritma, serta teknologi demi memecahkan masalah analitik yang sangat-sangat kompleks.