weka tutorial how download
Ta vadnica WEKA pojasnjuje, kaj je orodje Weka Machine Learning, njegove značilnosti in kako prenesti, namestiti in uporabljati programsko opremo Weka Machine Learning:
V Prejšnja vadnica , smo spoznali Support Vector Machine v ML in s tem povezane koncepte, kot so Hyperplane, Support Vectors & Applications of SVM.
Strojno učenje je področje znanosti, kjer stroji delujejo kot umetno inteligenten sistem. Stroji se lahko učijo sami, ne da bi morali izrecno kodirati. To je iterativni postopek, ki dostopa do podatkov, se uči sam in napoveduje rezultat. Za izvajanje nalog strojnega učenja je potrebno veliko orodij in skriptov.
WEKA je platforma za strojno učenje, sestavljena iz številnih orodij, ki olajšajo številne dejavnosti strojnega učenja.
=> Preberite celotno serijo usposabljanja za strojno učenje
Kaj se boste naučili:
- Kaj je WEKA
- Zaključek
Kaj je WEKA
Weka je odprtokodno orodje, ki so ga zasnovali in razvili znanstveniki / raziskovalci z Univerze Waikato na Novi Zelandiji. WEKA pomeni Waikato okolje za analizo znanja. Razvila ga je mednarodna znanstvena skupnost in se distribuira pod brezplačno licenco GNU GPL.
WEKA je v celoti razvita v Javi. Zagotavlja integracijo z bazo podatkov SQL s povezljivostjo Java Database. Ponuja številne algoritme strojnega učenja za izvajanje nalog rudarjenja podatkov. Te algoritme je mogoče uporabiti neposredno z orodjem WEKA ali pa z drugimi aplikacijami, ki uporabljajo programski jezik Java.
Ponuja veliko orodij za predhodno obdelavo podatkov, klasifikacijo, združevanje v skupine, regresijsko analizo, ustvarjanje pravil pridružitve, ekstrakcijo lastnosti in vizualizacijo podatkov. Je močno orodje, ki podpira razvoj novih algoritmov v strojnem učenju.
Zakaj uporabljati orodje za strojno učenje WEKA
Z WEKO so algoritmi strojnega učenja uporabnikom na voljo. Strokovnjaki za ML lahko te metode uporabijo za pridobivanje koristnih informacij iz velike količine podatkov. Tu lahko strokovnjaki ustvarijo okolje za razvoj novih metod strojnega učenja in njihovo uporabo na resničnih podatkih.
WEKA uporabljajo raziskovalci strojnega učenja in uporabnih znanosti za učne namene. Je učinkovito orodje za izvajanje številnih nalog rudarjenja podatkov.
Prenos in namestitev WEKA
# 1) Prenesite programsko opremo iz tukaj .
Preverite konfiguracijo računalniškega sistema in s te strani prenesite stabilno različico WEKA (trenutno 3.8).
#two) Po uspešnem prenosu odprite mesto datoteke in dvokliknite preneseno datoteko. Prikaže se čarovnik Step Up. Kliknite Naprej.
kje lahko brezplačno gledam anime
# 3) Odprli se bodo pogoji licenčne pogodbe. Temeljito ga preberite in kliknite »Strinjam se«.
# 4) Glede na vaše zahteve izberite komponente, ki jih želite namestiti. Priporočljiva je namestitev celotne komponente. Kliknite Naprej.
# 5) Izberite ciljno mapo in kliknite Naprej.
# 6) Nato se bo začela namestitev.
# 7) Če Java ni nameščena v sistemu, bo najprej namestila Java.
# 8) Po končani namestitvi se prikaže naslednje okno. Kliknite Naprej.
# 9) Potrdite polje Začni Weka. Kliknite Dokončaj.
# 10) Odpre se okno WEKA Tool in Explorer.
#eleven) Priročnik WEKA lahko prenesete s spletnega mesta tukaj.
Grafični uporabniški vmesnik podjetja WEKA
GUI WEKA ponuja pet možnosti: Raziskovalec, Experimenter, tok znanja, delovna miza in preprost CLI. Dovolite nam, da razumemo vsakega posebej.
# 1) Preprost CLI
Preprost CLI je Weka Shell z ukazno vrstico in izhodom. S pomočjo lahko vidite pregled vseh ukazov. Preprost CLI ponuja dostop do vseh razredov, kot so klasifikatorji, grozdi in filtri itd.
Nekateri preprosti ukazi CLI so:
- Odmor: Za zaustavitev trenutne niti
- Izhod: Zapustite CLI
- Pomoč (): Izpiše pomoč za navedeni ukaz
- -java weka.classifiers.trees.J48 -t c: /temp/iris.arff: Če želite priklicati razred WEKA, ga predponi z Javo. Ta ukaz bo usmeril WEKA, da naloži razred in ga izvede z danimi parametri. V tem ukazu se na naboru podatkov IRIS pokliče klasifikator J48.
# 2) Raziskovalec
Okna WEKA Explorer prikazujejo različne zavihke, ki se začnejo s predhodno obdelavo. Sprva je zavihek vnaprejšnje obdelave aktiven, saj je najprej nabor podatkov predobdelan, preden se nanj uporabijo algoritmi in raziskan nabor podatkov.
Zavihki so naslednji:
- Predobdelava: Izberite in spremenite naložene podatke.
- Razvrsti: Za podatke uporabite algoritme za usposabljanje in testiranje, ki bodo podatke razvrstili in regresirali.
- Grozd: Iz podatkov oblikujte grozde.
- Sodelavec: Izločite pravilo povezave za podatke.
- Izberite atribute: Uporabljajo se ukrepi za izbiro lastnosti.
- Vizualizirajte: Ogleda se 2D predstavitev podatkov.
- Vrstica stanja: Spodnji del okna prikazuje vrstico stanja. Ta razdelek prikazuje, kaj se trenutno dogaja v obliki sporočila, na primer nalaganja datoteke. Z desno miškino tipko kliknite to, Spomin informacije je mogoče videti, in tudi Teči smeti zbiralec za sprostitev prostora lahko zaženete.
- Gumb za dnevnik: Shrani dnevnik vseh dejanj v Weki s časovnim žigom. Dnevniki se prikažejo v ločenem oknu, ko kliknete gumb Dnevnik.
- Ikona ptice WEKA: Prisotna v spodnjem desnem kotu prikazuje WEKA bird z predstavlja število procesov, ki se izvajajo hkrati (za x.). Ko postopek teče, se ptica premika.
# 3) Eksperimentator
Gumb za preizkuševalce WEKA omogoča uporabnikom, da v enem poskusu na naboru podatkov ustvarijo, izvajajo in spreminjajo različne sheme. Eksperimentator ima dve vrsti konfiguracije: Preprosto in napredno. Obe konfiguraciji omogočata uporabnikom izvajanje poskusov lokalno in na oddaljenih računalnikih.
vprašanja za poslovnega analitika
- Gumba »Odpri« in »Novo« odpreta novo okno preizkusa, ki ga uporabniki lahko naredijo.
- Rezultati: Nastavite ciljno datoteko rezultata iz datotek ARFF, JDFC in CSV.
- Vrsta preizkusa: Uporabnik lahko izbira med navzkrižno validacijo in razdelitvijo odstotka vlaka / preizkusa. Uporabnik lahko izbira med klasifikacijo in regresijo glede na uporabljeni nabor podatkov in klasifikator.
- Nabori podatkov: Uporabnik lahko tukaj brska in izbira nabore podatkov. Če delate na različnih strojih, potrdite polje Relativna pot. Podprta oblika nabora podatkov je ARFF, C4.5, CSV, libsvm, bsi in XRFF.
- Ponavljanje: Privzeta številka ponovitve je nastavljena na 10. Nabori podatkov najprej in algoritmi najprej pomagajo pri preklapljanju med naborom podatkov in algoritmi, tako da je mogoče algoritme izvajati na vseh naborih podatkov.
- Algoritmi: Nove algoritme doda 'New Button'. Uporabnik lahko izbere klasifikator.
- Shranite poskus z gumbom Shrani.
- Zaženite preizkus z gumbom Zaženi.
# 4) Tok znanja
Tok znanja prikazuje grafični prikaz algoritmov WEKA. Uporabnik lahko izbere komponente in ustvari potek dela za analizo naborov podatkov. Podatki se lahko obdelujejo paketno ali postopoma. Vzporedni potek dela je mogoče načrtovati in vsak bo tekel v ločeni niti.
Na voljo so različni sestavni deli Viri podatkov, varčevalci podatkov, filtri, klasifikatorji, grozdi, vrednotenje in vizualizacija.
# 5) Delovna miza
WEKA ima modul delovne mize, ki vsebuje vse GUI v enem oknu.
Značilnosti WEKA Explorerja
# 1) Nabor podatkov
Nabor podatkov je sestavljen iz elementov. Predstavlja objekt na primer: v tržni bazi podatkov bo predstavljal kupce in izdelke. Nabori podatkov so opisani z atributi. Nabor podatkov vsebuje zbirke podatkov v zbirki podatkov. Nabor podatkov vsebuje atribute, ki so lahko nominalni, številski ali niz. V Weki nabor podatkov predstavlja weka.core.Insistance razred.
Predstavitev nabora podatkov s 5 primeri:
@data
sončno, LAŽNO, 85,85, št
sončno, RES, 80,90, št
oblačno, LAŽNO, 83,86, da
deževno, LAŽNO, 70,96, ja
deževno, LAŽNO, 68,80, da
Kaj je atribut?
Atribut je podatkovno polje, ki predstavlja značilnost podatkovnega predmeta. Na primer, v bazi podatkov strank bodo atributi customer_id, customer_email, customer_address itd. Atributi imajo različne vrste.
Te možne vrste so:
A) Nominalni atributi: Atribut, ki se nanaša na ime in ima vnaprej določene vrednosti, kot so barva, vreme. Ti atributi se imenujejo kategorični atributi . Ti atributi nimajo nobenega vrstnega reda in njihove vrednosti se imenujejo tudi enumeracije.
@attribute outlook {sončno, oblačno, deževno}: izjava o nominalnem atributu.
B) Binarni atributi: Ti atributi predstavljajo samo vrednosti 0 in 1. To so tipi nominalnih atributov s samo dvema kategorijama. Ti atributi se imenujejo tudi logične vrednosti.
C) Redni atributi: Atributi, ki ohranjajo določen vrstni red ali uvrstitev med njimi, so redni atributi. Zaporednih vrednosti ni mogoče predvideti, ampak se ohrani le vrstni red. Primer: velikost, razred itd.
D) Številski atributi: Atributi, ki predstavljajo merljive količine, so številski atributi. Ti so predstavljeni z realnimi števili ali celoštevilkami. Primer: temperatura, vlažnost.
@attribute vlažnost real: deklaracija številskega atributa
E) Atributi nizov: Ti atributi predstavljajo seznam znakov, predstavljenih v dvojnih narekovajih.
# 2) Podatkovna oblika ARFF
WEKA deluje na datoteki ARFF za analizo podatkov. ARFF pomeni Format datoteke z razmerjem atributov. Ima 3 razdelke: relacija, atributi in podatki. Vsak odsek se začne z '@'.
Datoteke ARFF zajemajo atribute Nominal, Numeric, String, Date in Relational. Nekateri znani nabori podatkov o strojnem učenju so v WEKI prisotni kot ARFF.
Format za ARFF je:
@odnos
@attribute
@data
Primer datoteke ARFF je:
@relation weather @attribute outlook {sunny, overcast, rainy}: @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} //class attribute: The class attribute represents the output. @data sunny, FALSE,85,85,no sunny, TRUE,80,90,no overcast, FALSE,83,86,yes rainy, FALSE,70,96,yes rainy, FALSE,68,80,yes
# 3) Oblika podatkov XRFF
XRFF pomeni XML atribut Relation File Format. Predstavlja podatke, ki lahko shranijo komentarje, atribute in uteži primerkov. Ima pripono .xrff in pripono datoteke .xrff.gz (stisnjena oblika). Datoteke XRFF so predstavljale podatke v obliki XML.
# 4) Povezava z bazo podatkov
Z WEKA je enostavno povezati bazo podatkov z gonilnikom JDBC. Za povezavo z bazo podatkov je potreben gonilnik JDBC, primer:
MS SQL Server (com.microsoft.jdbc.sqlserver.SQLServerDriver)
kako odpreti .jnlp datoteke
Oracle (oracle.jdbc.driver.OracleDriver)
# 5) Klasifikatorji
Za napoved izhodnih podatkov vsebuje WEKA klasifikatorje. Razpoložljivi algoritmi za učenje so drevesa odločitev, podporni vektorski stroji, klasifikatorji, ki temeljijo na primerkih, in logistična regresija ter Bayesova omrežja. Odvisno od zahteve s preskusom in testom lahko uporabnik najde ustrezen algoritem za analizo podatkov. Klasifikatorji se uporabljajo za razvrščanje naborov podatkov na podlagi značilnosti atributov.
# 6) Grozdanje
WEKA z zavihkom Grozd predvideva podobnosti v naboru podatkov. Na podlagi združevanja v gruče lahko uporabnik ugotovi atribute, uporabne za analizo, in prezre druge atribute. Razpoložljivi algoritmi za združevanje v WEKA so k-srednja, EM, pajčevina, X-srednja in FarhtestFirst.
# 7) Združenje
Edini algoritem, ki je na voljo v WEKA za ugotavljanje pravil pridružitve, je Apriori.
# 8) Ukrepi oddelka za atribute
WEKA uporablja dva pristopa za najboljšo izbiro lastnosti za namen izračuna:
- Uporaba algoritma metode iskanja: Najboljše-prvo, naprej izbira, naključno, izčrpno, genetski algoritem in algoritem za uvrstitev.
- Uporaba algoritmov metode ocenjevanja: Na korelacijski osnovi, ovoj, pridobitev informacij, hi-kvadrat.
# 9) Vizualizacija
WEKA podpira 2D predstavitev podatkov, 3D vizualizacije z vrtenjem in 1D predstavitev enega atributa. Ima možnost »Jitter« za nominalne atribute in »skrite« podatkovne točke.
Druge glavne značilnosti WEKA so:
- Gre za odprtokodno orodje z grafičnim uporabniškim vmesnikom v obliki 'Explorer', 'Experimenter' in 'Knowledge Flow'.
- Je neodvisen od platforme.
- Vsebuje 49 orodij za predhodno obdelavo podatkov.
- V WEKA je prisotnih 76 algoritmov za klasifikacijo in regresijo, 8 algoritmov za združevanje
- Ima 15 algoritmov za izbiro atributov in 10 algoritmov za izbiro lastnosti.
- Ima 3 algoritme za iskanje pravila povezave.
- Z uporabo WEKE lahko uporabniki razvijejo kodo po meri za strojno učenje.
Zaključek
V tej vadnici WEKA smo predstavili odprtokodno programsko opremo za strojno učenje WEKA in podrobno razložili postopek prenosa in namestitve. Ogledali smo si tudi pet možnosti, ki so na voljo za grafični uporabniški vmesnik Weka, in sicer Explorer, Experimenter, Tok znanja, Workbench in Simple CLI.
O značilnostih WEKE smo se seznanili tudi s primeri. Funkcije vključujejo nabor podatkov, format podatkov ARFF, povezljivost z bazo podatkov itd.
=> Obiščite tukaj za ekskluzivno serijo strojnega učenja
Priporočeno branje
- Nabor podatkov WEKA, klasifikator in algoritem J48 za drevo odločanja
- WEKA Explorer: Vizualizacija, združevanje v gruče, rudarjenje pravil pridruževanja
- 11 Najbolj priljubljenih orodij za strojno učenje v letu 2021
- Popoln vodnik po umetni nevronski mreži v strojnem učenju
- Data Mining Vs Machine Learning Vs Umetna inteligenca Vs Poglobljeno učenje
- Vadnica za strojno učenje: Uvod v ML in njegove aplikacije
- 13 najboljših podjetij za strojno učenje (posodobljen seznam 2021)
- Kaj je podporni vektorski stroj (SVM) pri strojnem učenju