Data mining letar efter dolda, giltiga och alla möjliga användbara mönster i stora datamängder. Data Mining är en teknik som hjälper dig att upptäcka oväntade / oupptäckta relationer mellan data för affärsvinster.
Det finns många användbara verktyg tillgängliga för datautvinning. Nedan följer en samlad lista över de 25 bästa handplockade programvarorna för datautvinning med populära funktioner och senaste nedladdningslänkar. Denna jämförelselista innehåller öppen källkod samt kommersiella verktyg.
1) SAS Data mining:
Statistiskt analyssystem är en produkt från SAS. Den utvecklades för analys och datahantering. Det erbjuder ett grafiskt användargränssnitt för inte tekniska användare.
Funktioner:
- SAS Data mining-verktyg hjälper dig att analysera Big data
- Det är ett idealiskt verktyg för datautvinning, textbrytning och optimering.
- SAS erbjuder arkitekturen för distribuerad minnesbehandling som är mycket skalbar
Hämta länk: https://www.sas.com/en_us/insights/analytics/data-mining.html
2) Teradata:
Teradata är ett massivt parallellt öppet behandlingssystem för att utveckla storskaliga applikationer för datalagring. Teradata kan köras på Unix / Linux / Windows-serverplattform.
Funktioner:
- Teradata Optimizer kan hantera upp till 64 sammanfogningar i en fråga.
- Tera-data har en låg total ägandekostnad. Det är enkelt att installera, underhålla och administrera.
- Det stöder SQL för att interagera med data som lagras i tabeller. Det ger dess förlängning.
- Det hjälper dig att distribuera data till diskarna automatiskt utan manuell intervention.
- Teradata tillhandahåller in- och urladdningsverktyg för att flytta data till / från Teradata System.
Ladda ner länk: https://www.teradata.in/Products/Cloud/IntelliCloud
3) R-programmering
R är ett språk för statistisk beräkning och grafik. Den används också för stor dataanalys. Det ger ett brett utbud av statistiska tester.
Funktioner:
- Effektiv datahantering och lagringsanläggning,
- Det ger en uppsättning operatörer för beräkningar på matriser, i synnerhet matriser,
- Det ger en sammanhängande, integrerad samling av stora datavärktyg för dataanalys
- Det ger grafiska möjligheter för dataanalys som visas antingen på skärmen eller på papperskopia.
Nedladdningslänk; https://www.r-project.org/
4) STYRELSE
Board är en Management Intelligence Toolkit. Den kombinerar funktioner i affärsinformation och företagsledning. Den är utformad för att leverera affärsinformation och affärsanalys i ett enda paket.
Funktioner:
- Låter dig analysera, simulera, planera och förutsäga med en enda plattform
- Att bygga anpassade analys- och planeringsapplikationer.
- Board All-In-One kombinerar BI, Corporate Performance Management och Business Analytics.
- Det ger företag möjlighet att utveckla och underhålla sofistikerade analys- och planeringsapplikationer.
- Den egna plattformen hjälper till att rapportera genom att komma åt flera datakällor.
Nedladdningslänk: https://www.board.com/en
5) Dundor
Dundas är ett företagsklart verktyg för datautvinning som kan användas för att bygga och visa interaktiva instrumentpaneler, rapporter etc. Du kan distribuera Dundas BI som den centrala dataportalen för organisationen.
Funktioner:
- Serverapplikation med full produktfunktionalitet
- Integrera och få tillgång till alla typer av datakällor
- Anpassningsbara datavisualiseringar
- Smart dra och släpp-verktyg
- Visualisera data via kartor
- Förutsägande och avancerad dataanalys
Ladda ner länk: http://www.dundas.com/support/dundas-bi-free-trial
6) Inetsoft
Inetsofts datagruppsverktygsstil Intelligens är användbar datagrupp och intelligensplattform. Det möjliggör snabb och flexibel omvandling av data från olika källor.
Funktioner:
- Det hjälper dig att komma åt strukturerade och halvstrukturerade källor, lokala applikationer
- Låter dig optimera appar för dataförbrukning och uppdatering
- Erbjud skräddarsydda och säkra nivåer av datautforskning och rapportering.
- Skala upp för stora datamängder av användare som använder Inbuilt Spark-plattformen
- Skapa paginerade rapporter med inbäddad affärslogik och parametrering
Hämta länk: https://www.inetsoft.com/products/StyleIntelligence/
7) H3O
H3O är ett annat utmärkt programvara för öppen källkod Data mining. Den används för att utföra dataanalys av data som finns i applikationssystem för molntjänster.
Funktioner:
- Med H3O kan du dra nytta av datorkraften hos distribuerade system och datorer i minnet
- Det möjliggör snabb och enkel distribution i produktion med Java och binärt format.
- Det hjälper dig att använda programmeringsspråken som R,
- Python och andra för att bygga en modell i H3O
- Distribuerad bearbetning i minnet
Nedladdningslänk: https://www.h3o.ai/
8) Qlik
Qlik är verktyg för datautvinning och visualisering. Det erbjuder också instrumentpaneler och stöder flera datakällor och filtyper.
Funktioner:
- Dra och släpp gränssnitt för att skapa flexibla, interaktiva datavisualiseringar
- Svara direkt på interaktioner och förändringar.
- Stöder flera datakällor och filtyper
- Det möjliggör enkel säkerhet för data och innehåll på alla enheter.
- Det låter dig dela relevanta analyser, inklusive appar och berättelser, med hjälp av ett centraliserat nav.
Nedladdningslänk: https://www.qlik.com/us/products/qlik-sense
9) RapidMiner:
RapidMiner är ett kostnadsfritt dataanvändningsverktyg. Den används för dataförberedelse, maskininlärning och modelldistribution. Det erbjuder en rad produkter för att bygga nya processer för datautvinning och förutsägbar installationsanalys.
Funktioner:
- Tillåt flera datahanteringsmetoder
- GUI eller batchbehandling
- Integreras med egna databaser
- Interaktiva, delbara instrumentpaneler
- Förutsägbar analys av Big Data
- Fjärranalysbehandling
- Datafiltrering, sammanfogning, sammanslagning och aggregering
- Bygg, träna och validera prediktiva modeller
- Rapporter och utlösa meddelanden
Nedladdningslänk: https://my.rapidminer.com/nexus/account/index.html#downloads
10) Oracle BI
Oracle BI är en öppen källkod maskininlärning och datavisualisering för nybörjare och experter. Interaktiva arbetsflöden för dataanalys med en stor verktygslåda.
Funktioner:
- Interaktiv datavisualisering.
- Det erbjuder interaktiv datautforskning för snabb kvalitativ analys med rena visualiseringar.
- Orange stöder praktisk träning och visuella illustrationer av begrepp från datavetenskap.
- Det erbjuder ett omfattande utbud av tillägg till datautvinning från externa datakällor.
Hämta länk: https://orange.biolab.si/
11) KNIME
KNIME är programvara med öppen källkod för att skapa datavetenskapliga applikationer och tjänster. Detta verktyg för datautvinning hjälper dig att förstå data och att designa arbetsflöden för datavetenskap.
Funktioner:
- Hjälper dig att skapa ett slut-till-slut-datavetenskap-arbetsflöden
- Blanda data från valfri källa
- Låter dig samla, sortera, filtrera och gå med i data antingen på din lokala maskin, i databas eller i distribuerade stora datamiljöer.
- Bygg maskininlärningsmodeller för klassificering, regression, dimensionreduktion
Nedladdningslänk: https://www.knime.com/software-overview
12) Tanagra
Tangra är ett kostnadsfritt dataanvändningsverktyg för studier och forskningsändamål. Det erbjuder olika data mining metoder från statistiskt lärande, dataanalys och maskininlärning.
Funktioner:
- Erbjuder lättanvänd mjukvara för forskare och studenter
- Det tillåter användaren att lägga till sina data mining metoder.
Nedladdningslänk: https://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
13) Lösare:
Solvers XLminer är lätt att använda professionell nivå data mining verktyg för datavisualisering, prognoser och data mining i Excel. Det erbjuder omfattande uppsättning funktioner för dataförberedelse för att importera och rengöra dina data.
Funktioner:
- XLMiner erbjuder en omfattande uppsättning analysfunktioner baserade både på statistiska metoder och maskininlärningsmetoder.
- Verktyget låter dig arbeta med stora datamängder som kan överskrida gränserna i Excel.
- Det erbjuder inbyggda funktioner för datautforskning och visualisering.
- Att utforska data ger snabb insikt i dolda relationer i data.
Nedladdningslänk: https://www.solver.com/xlminer-data-mining
14) Sisense
Sisense är ett annat effektivt data mining-verktyg. Det analyserar och visualiserar omedelbart både stora och olika datauppsättningar. Det är ett perfekt verktyg för att skapa instrumentpaneler med en mängd olika visualiseringar.
Funktioner:
- Gör det möjligt att bygga interaktiva instrumentpaneler utan tekniska färdigheter
- Skapa en enda version av sanningen med sömlös data
- Förena orelaterade data till en central plats
- Öst-dra-och-släpp-användargränssnitt
- Tillåter åtkomst till instrumentpaneler även i den mobila enheten
- Iögonfallande visualisering
- Identifierar kritiska mätvärden med hjälp av filtrering och beräkningar
- Hanterar storskalig data på en enda handelsserver
Nedladdningslänk: https://www.sisense.com/
15) Data smälter
DataMelt är ett kostnadsfritt verktyg för numerisk beräkning, matematik, dataanalys och datavisualisering. Detta program erbjuder dig enkelheten i skriptspråk, som Python, Ruby, Groovy med hundratals Java-paket.
Funktioner:
- DataMelt erbjuder statistik, analys av stora datamängder och vetenskaplig visualisering.
- Du kan använda den med olika programmeringsspråk på olika operativsystem.
- Det låter dig skapa högkvalitativa vektorgrafikbilder (EPS, SVG, PDF, etc.), som kan inkluderas i LaTeX och en annan textbehandlare.
- Data Melt erbjuder användning av skriptspråk, som är betydligt snabbare än standard Python implementerad i C.
Hämta länk: https://jwork.org/dmelt/
16) ELKI:
ELKI är ett öppen källkodsverktyg skrivet i Java. Verktyget låter oss undersöka algoritmer, med tonvikt på metoder utan tillsyn i klusteranalys och detektering av outlier.
Funktioner:
- ELKI erbjuder en omfattande samling av mycket parametrerbara algoritmer
- Det möjliggör enkel och rättvis utvärdering och benchmarking av algoritmer.
- ELKI tillhandahåller dataindexstrukturer såsom R * -trädet som förbättrar processen för datautvinning
Hämta länk : https://elki-project.github.io/
17) SPMF
SPMF är ett open source-data mining-bibliotek skrivet i Java. Det distribueras under GPL-licensen. Det låter dig integrera källkoden med annan Java-programvara.
Funktioner:
- Tillåter anslutning regel gruvdrift
- Stöder sekventiell mönster och sekventiell regelbrytning
- Erbjuder gruvdrift med hög nytta,
- Tidsseriebrytning.
- Stöd komplexa processer av kluster och klassificering
Hämta länk: http://www.philippe-fournier-viger.com/spmf/
18) Alteryx
Alteryx är en Business Intelligence och analyslösningar för företaget. Det är ett specialdesignat verktyg för dataanalytiker och företagsledare.
Funktioner:
- Analytics för medelstora företag
- Det möjliggör ad hoc-analys.
- Erbjuder snabb online analytisk bearbetning
- Automatisk schemalagd rapportering
- Mycket anpassningsbar instrumentpanel
Nedladdningslänk: https://www.alteryx.com/
19) Enterprise Miner
Enterprise Miner är en SAS-programvara som erbjuder dig och banbrytande algoritmer som är utformade för att hjälpa dig att lösa de viktigaste utmaningarna och erbjuder de bästa lösningarna för ditt företag.
Funktioner:
- Hjälper dig att förbättra förutsägelsenoggrannheten. Dela pålitliga resultat
- Enkel att använda GUI och batchbearbetning
- Avancerad prediktiv och beskrivande modellering
- Erbjuder automatiserad poängsättning
- Automatisera modelldistribution och poängsättning
Nedladdningslänk: https://www.sas.com/en_us/software/enterprise-miner.html
20) Datawatch
Datawatch Desktop är en Data mining och Business Intelligence-lösning. Det låter dig fokusera på datavisualisering i realtid. Det erbjuder verktyg för att bygga och distribuera sina övervaknings- och analyssystem utan att behöva skriva en enda kodrad.
Funktioner:
- Dra-och-släpp-funktionen tillåter användare att skapa en anpassad vy av data
- Identifiera handelsavvikelser
- Analysera hur alternativa scenarier kommer att påverka prestanda med historisk data
Hämta länk: https://www.datawatch.com/in-action/panopticon-streaming-analytics-platform/
21) Avancerad gruvarbetare
En avancerad gruvarbetare är ett användbart verktyg för databehandling, analys och modellering. Det användarvänliga arbetsflödesgränssnittet gör att du kan utforska olika typer av data.
Funktioner:
- Extrahera och spara data från / till olika databassystem, filer och datatransformationer
- Erbjuder olika operationer på data, som provtagning, sammanfogning av datamängder, etc.
- Hjälper dig att bygga statistiska modeller, analys av variabel betydelse, klusteranalys etc.
- Enkel och effektiv modellintegrering med externa IT-applikationer
Ladda ner länk: https://algolytics.com/products/advancedminer/
22) Analytisk lösare
Analytisk lösare är gratis att använda peka-och-klicka-verktyget. Det låter dig göra riskanalys och receptanalys i din webbläsare. Det erbjuder full-kraft Data mining jobb.
Funktioner:
- Hjälper dig att införliva osäkerhet och lösa med simuleringsoptimering, stokastisk programmering och robust optimering.
- Låter dig definiera Monte Carlo-simuleringsmodellen med hjälp av Excel-formler
Hämta länk: https://analyticsolver.com/
23) PolyAnalyst
PolyAnalyst är Data mining och analytiskt verktyg för att extrahera handlingsbar kunskap dold och faktisk strukturerad av data.
Funktioner:
- Hjälper dig att komma åt data från olika källor och slå samman data från olika källor
- Du kan välja mellan ett brett urval av statistiska algoritmer och maskininlärningsalgoritmer.
- Erbjuder dig att skapa fyllningsrapport som kan sammanfattas och kommunicera din insikt
Hämta länk: https://www.megaputer.com/polyanalyst/
24) Civis
Civis som ger dig möjlighet att fatta välgrundade beslut med datavetare och beslutsmarknad i åtanke. Det gör att ditt team kan samarbeta effektivt och hitta lösningar snabbare.
Funktioner:
- Erbjuder arkitektur, produkter och processer som hjälper dig att skydda dina data
- Du kan konfigurera med ett bibliotek med datainmatning och ETL-moduler.
- Skriv kod i ett skript, erbjuder flera skript eller jobb i ett arbetsflöde och definiera ett arbetsflöde som ska köras enligt ett schema.
- Låter dig förvandla din analys och modeller till applikationer som körs på en flexibel infrastruktur på produktionsnivå
Ladda ner länk: https://www.civisanalytics.com/civis-platform/
25) Viscovery:
Viscovery är ett arbetsflödesorienterat programvarupaket. Den är baserad på självorganiserande kartor och multivariat statistik för explorativ datautvinning och prediktiv modellering. Systemet utmärker sig i intuitiv användarhandledning, mogen implementering.
Funktioner:
- En idealisk projektmiljöplattform för målinriktad drift
- Dedikerade arbetsflöden som gör att du kan erbjuda fokuserad navigering
- Rensa arbetsflödessteg med beprövade standardinställningar
- Arbetsflödesförgrening möjliggör generering av modellvariationer
- Funktioner för integrerad dokumentation och anteckning
- Flera hanteringsverktyg för att underlätta användningen
Nedladdningslänk: https://www.viscovery.net/somine/