Zobrazuje předpovědi modelů na datech.
Vstupy
- Data: vstupní datový soubor
- Prediktoři: prediktory, které mají být použity v datech
Výstupy
- Předpovědi: data s přidanými předpovědi
- Výsledky hodnocení: výsledky testování klasifikačních algoritmů
Widget obdrží sadu dat a jeden nebo více prediktorů (prediktivní modely, nikoli učící se algoritmy - viz příklad níže). Vytváří data a předpovědi.
- Informace o vstupu, jmenovitě počet případů, které je třeba předpovídat, počet prediktorů a úkol (klasifikace nebo regrese). Pokud jste datovou tabulku setřídili podle atributu a chcete vidět původní zobrazení, stiskněte Obnovit původní pořadí .
- Můžete vybrat možnosti pro klasifikaci. Jestliže odhad třída je zaškrtnuto, pohled poskytuje informace o předpokládané třídě. Pokud je zaškrtnuto Předvídané pravděpodobnosti pro , pohled poskytuje informace o pravděpodobnostech předvídaných klasifikátory. Můžete také vybrat předpovídanou třídu zobrazenou v pohledu. Volba Draw distribuční pruhy poskytuje vizualizaci pravděpodobností.
- Zaškrtnutím políčka Zobrazit úplný dataset můžete zobrazit celou tabulku dat (jinak se zobrazí pouze proměnná třídy).
- Vyberte požadovaný výstup.
- Předpovědi.
Widget ukazuje pravděpodobnosti a konečná rozhodnutí prediktivních modelů . Výstupem widgetu je další dataset, kde jsou předpovědi připojeny jako nové atributy meta. Můžete si vybrat, které funkce chcete na výstupu (původní data, předpovědi, pravděpodobnosti). Výsledek lze pozorovat v tabulce dat . Pokud předpokládaná data obsahují skutečné hodnoty třídy, lze výsledek predikce pozorovat také v matici Confusion Matrix .
Příklady
V prvním příkladu použijeme data Attrition - Train z widgetu Datasets . Jedná se o údaje o opotřebení zaměstnanců. Jinými slovy, chceme vědět, zda určitý zaměstnanec rezignuje nebo ne. Postavíme prediktivní model s widgetem Strom a pozorujeme pravděpodobnosti v Předpovědích .
Pro předpovědi potřebujeme jak tréninková data, která jsme načtili do prvního widgetu Datasets, tak data, která budou předpovídat, která načteme do dalšího widgetu Datasets . Tentokrát použijeme Attrition - Predict data. Připojte druhou sadu dat k předpovědím . Nyní vidíme předpovědi pro tři instance dat z druhé sady dat.
Model Tree předpovídá, že žádný ze zaměstnanců neopustí společnost. Můžete vyzkoušet jiný model a zjistit, zda se předpovědi změní. Nebo otestujte prediktivní skóre nejprve v widgetu Test a skóre .
Tentokrát používáme data heart disease.tab z widgetu File . K datům se dostanete prostřednictvím rozbalovací nabídky. Toto je dataset s 303 pacienty, kteří přišli k lékaři a trpěli bolestí na hrudi. Po provedení testů bylo zjištěno, že někteří pacienti mají zúžení průměru a jiní ne (to je naše proměnná třídy).
Údaje o srdečních onemocněních mají některé chybějící hodnoty a my bychom za to měli odpovídat. Nejprve rozdělíme datový soubor na vlak a testovací data pomocí Data Sampler .
Poté zašleme vzorek dat do Preprocess . Použijeme hodnoty Impute Missing Values , ale na vašich datech můžete vyzkoušet libovolnou kombinaci preprocesorů. Předběžně zpracovaná data zašleme do Logistické regrese a vytvořený model do Předpovědí .
A konečně, předpovědi také potřebují data, která budou předpovídat. Výstup Data Sampler použijeme pro predikci, ale tentokrát ne Data Sample , ale Zbývající data , to jsou data, která nebyla použita pro trénink modelu.
Všimněte si, jak zbývající data odesíláme přímo do předpovědí, aniž bychom museli provádět předzpracování. Důvodem je, že Orange zpracovává předzpracování nových dat interně, aby se předešlo jakýmkoli chybám ve konstrukci modelu. Pro předpovědi bude použit stejný stejný preprocesor, jaký byl použit v tréninkových datech. Stejný postup platí i pro test a skóre .
Komentáře
Okomentovat