Data Science Studi Kasus Pemain Sepak Bola


    Data science adalah bidang studi yang menggabungkan matematika, statistika, dan ilmu komputer untuk mengekstraksi pengetahuan dan wawasan yang berharga dari data. Tujuan utama data science adalah memahami pola, tren, dan informasi tersembunyi yang terkandung dalam data untuk mengambil keputusan yang lebih baik dan mendukung pengambilan keputusan yang didasarkan pada bukti.

    Proses data science melibatkan beberapa langkah, termasuk pengumpulan data, pembersihan data, eksplorasi data, pemodelan, dan komunikasi hasil. Data yang digunakan dalam analisis data science bisa berupa data terstruktur (seperti data tabel atau basis data) maupun data tidak terstruktur (seperti teks, gambar, atau suara).

    Teknik dan alat yang digunakan dalam data science meliputi statistika, analisis prediktif, machine learning, deep learning, visualisasi data, pengolahan bahasa alami, dan penggalian data. Data science telah diterapkan dalam berbagai bidang, termasuk bisnis, kesehatan, keuangan, pemasaran, ilmu sosial, transportasi, dan banyak lagi.

    Profesional data science, yang dikenal sebagai data scientist, menggunakan keterampilan dan alat yang relevan untuk menjelajahi data, membuat model prediktif, mengidentifikasi tren, dan memberikan wawasan berharga kepada organisasi atau individu yang mereka layani. 

    Nah pada kesempatan kali ini, admin akan berbagi cara mengolah data menggunakan python. yuk simak tutorialnya :)

 

Bahan :
1. Aplikasi Anaconda navigator
2. File CSV [kamu bisa dapatkan file dataset CSV di www.kaggle.com]

 

Langkah - langkah :
1. Buka Aplikasi Anaconda Navigator, unduh disini
2. jalankan Jupyter Notepad
3. Letakan file CSV di folder yang sama dengan file pykernel
4. Buat File Python dengan cara klik new -> python 3 (pykernel)
5. Masukan perintah seperti di bawah ini :

 

INPUT

import pandas as pd
pd.read_csv('fifa2019.csv', encoding="ISO-8859-1")
data_frame = pd.read_csv('fifa2019.csv')
data_frame

OUTPUT

FUNGSI

Berfungsi untuk mengimpor modul pandas dan membaca file fifa2019.csv

 

INPUT

data_frame.shape

OUTPUT

FUNGSI

Berfungsi untuk menampilkan ukuran baris dan kolom

 

INPUT

data_frame.describe()

OUTPUT

FUNGSI

Berfungsi untuk menampilkan total data

 

INPUT

data_frame.values

OUTPUT

FUNGSI

Berfungsi untuk menampilkan data dalam bentuk baris

 

INPUT

data_frame[data_frame["Age"]>40].head()

OUTPUT

FUNGSI

Berfungsi untuk menampilkan data pemain diatas 40th

 

INPUT

df1 = pd.DataFrame(data_frame, columns=['Name', 'Wage', 'Value'])
df1

OUTPUT

                                         

FUNGSI

Berfungsi untuk membuat data baru dengan ketentuan tertentu

 

INPUT

df1 = pd.DataFrame(data_frame, columns=['Name', 'Wage', 'Value'])
def value_to_float(x):
    if type(x) == float or type(x) == int:
        return x
    if 'K' in x:
        if len(x) > 1:
            return float(x.replace('K', '')) * 1000
        return 1000.0
    if 'M' in x:
        if len(x) > 1:
            return float(x.replace('M', '')) * 1000000
        return 1000000.0
    if 'B' in x:
        return float(x.replace('B', '')) * 1000000000
    return 0.0
wage = df1['Wage'].replace('[\€,]', '', regex=True).apply(value_to_float)
value = df1['Value'].replace('[\€,]', '', regex=True).apply(value_to_float)

df1['Wage'] = wage
df1['Value'] = value

df1['difference'] = df1['Value'] - df1['Wage']
df1

OUTPUT

FUNGSI

Berfungsi untuk mengubah data ke float

 

INPUT

import seaborn as sns
sns.set()
graph = sns.scatterplot(x='Wage', y='Value', data=df1)
graph

OUTPUT

FUNGSI

Berfungsi untuk menampilkan data dalam bentuk graphic


INPUT

from bokeh.plotting import figure,show
from bokeh.models import HoverTool

TOOLTIPS = HoverTool(tooltips=[
    ("index", "$index"),
    ("(Wage,Value)", "(@Wage, @Value)"),
    ("Name", "@Name")]
)

p = figure(title="Soccer 2019", x_axis_label='Wage', y_axis_label='Value', plot_width=700, plot_height=700, tools=[TOOLTIPS])
p.circle('Wage', 'Value', size=10, source=df1)
show(p)

OUTPUT

FUNGSI

Berfungsi untuk menampilkan data dalam bentuk graphic lebih detail

 Link Download bahan di atas : unduh disini

Laporan file html : lihat di sini

===============================

fifa2019 = lihat di sini

fifa2020 = lihat di sini

fifa2021 = lihat di sini

fifa2022 = lihat di sini

fifa2023 = lihat di sini

Related Posts:

0 comments:

Posting Komentar