Orange je skvělý nástroj pro dolování dat jak pro začátečníky, tak pro vědce s odbornými údaji. Díky svému uživatelskému rozhraní se mohou uživatelé zaměřit na analýzu dat namísto namáhavého kódování, což zjednodušuje konstrukci komplexních datových analytických potrubí.
Těžba dat na základě komponent
V Orangeu se analýza dat provádí skládáním komponent do pracovních toků. Každá komponenta, nazývaná widget, obsahuje nějaký úkol získávání dat, předzpracování, vizualizaci, modelování nebo vyhodnocení. Kombinace různých widgetů v pracovním postupu vám umožňuje vytvářet komplexní schémata analýzy dat za běhu. S velkou knihovnou widgetů nebudete mít na výběr. Další widgety jsou k dispozici prostřednictvím doplňků a umožňují cílenější a tematicky zaměřený výzkum.
Interaktivní průzkum dat
Oranžové widgety spolu komunikují. Přijímají data na vstupu a odesílají filtrovaná nebo zpracovaná data, modely nebo cokoli, co udělá widget na výstupu. Řekněme, začněte s widgetem File, který čte data a připojí jeho výstup k jinému widgetu, řekněme k datové tabulce, a máte funkční pracovní postup. Při jakékoli změně v jednom widgetu se změny okamžitě šíří prostřednictvím následného pracovního postupu. Změna datového souboru v widgetu File vyvolá odpověď ve všech následných widgetech. To je obzvláště zábavné, pokud jsou widgety otevřené a kdy můžete okamžitě vidět výsledky jakýchkoli změn těchto dat, parametrů metod nebo výběrů v interaktivních vizualizacích. Například v níže uvedeném jednoduchém pracovním postupu, kdy se výběr dat v tabulce šíří do rozptylového grafu,
Výběrem správných widgetů a jejich propojení je snadné vytvořit komplexní pracovní postupy pro širokou škálu úkolů analýzy dat.
Rozumné rozhraní pro návrh pracovního postupu
Orange se snadno používá i pro úplné nováčky. Začněte s widgetem File a Orange automaticky navrhne další widgety, které k němu lze připojit. Například Orange ví, že po nastavení widgetu Vzdálenosti budete pravděpodobně chtít hierarchické klastry. Všechny ostatní výchozí hodnoty v widgetech jsou také nastaveny tak, aby umožňovaly jednoduchou analýzu i bez toho, že by se toho hodně vědělo o statistice, strojovém učení nebo obecně průzkumu těžby dat.
Komentáře
Okomentovat