Orange Data Mining: Aprendizaje automático de código abierto y visualización de datos
Un software de minería de datos de código abierto que se utiliza para visualizar, analizar y modelar datos.
¿Qué es Orange Data Mining?
Orange es un software de minería de datos de código abierto que se utiliza para visualizar, analizar y modelar datos.
Orange proporciona una interfaz gráfica de usuario que permite a los usuarios crear flujos de trabajo de minería de datos, arrastrando y soltando widgets en una paleta. Los widgets pueden ser desde una simple tabla de datos, una gráfica, un modelo de aprendizaje automático o incluso una interfaz personalizada.
El software es capaz de realizar tareas como preprocesamiento de datos, clasificación, regresión, clustering, análisis de redes, visualización de datos, y más. También es compatible con muchos formatos de archivo de datos, incluyendo CSV, Excel, SQL y otros.
Además, la comunidad de usuarios de Orange es muy activa, lo que significa que hay muchos recursos disponibles en línea, como tutoriales, videos y documentación, así como una amplia gama de widgets personalizados desarrollados por la comunidad.
¿Quiénes son sus creadores?
Orange fue creado por el Bioinformatics Laboratory de la Facultad de Ciencias de la Computación e Informática de la Universidad de Ljubljana, en Eslovenia. El proyecto fue iniciado en 1997 por Blaž Zupan y Janez Demšar, y desde entonces ha sido desarrollado por un equipo de investigadores y desarrolladores en la universidad.
El Bioinformatics Laboratory de la Universidad de Ljubljana es un laboratorio de investigación interdisciplinario que se enfoca en la aplicación de técnicas de minería de datos y aprendizaje automático a la bioinformática y la biología molecular.
El equipo detrás de Orange tiene una fuerte experiencia en investigación y desarrollo de minería de datos y aprendizaje automático, y ha publicado numerosos artículos y libros en el campo. Además, Orange es utilizado por investigadores y estudiantes de todo el mundo, y ha sido incluido en el plan de estudios de varias universidades.
¿Cómo usar Orange Data Mining?
Descargar e instalar: Descargue el paquete de distribución de Orange y ejecute el archivo de instalación en su computadora local. Siga las guías de instalación para su sistema operativo.
Tutoriales de YouTube: Introducción al software de minería de datos de Orange. Obtenga información sobre el desarrollo de los flujos de trabajo de Orange, la carga de datos, los algoritmos básicos de aprendizaje automático y las visualizaciones interactivas. Los tutoriales en video están disponibles en el botón a continuación.
Ejemplos de flujo de trabajo: Software Orange incluye una amplia gama de plantillas de flujo de trabajo diseñadas para ayudarlo a familiarizarse con la aplicación. Elija plantillas en la pantalla de bienvenida para explorar.
Catálogo de widgets: Los widgets de Orange son componentes básicos de los flujos de trabajo de análisis de datos que se ensamblan en el entorno de programación visual de Orange. Los widgets se agrupan en clases según su función. Un flujo de trabajo típico puede combinar widgets para la entrada y el filtrado de datos, la visualización y la extracción predictiva de datos. Aquí puede obtener una lista de todos los widgets disponibles en Orange.
Librería para Python: Esta es una breve introducción a las secuencias de comandos en Orange , una biblioteca de minería de datos de Python 3.
Documentación: Toda la documentación disponible de Orange Data Mining.
Visualización interactiva de datos
Orange tiene que ver con las visualizaciones de datos que ayudan a descubrir patrones de datos ocultos, brindan intuición detrás de los procedimientos de análisis de datos o respaldan la comunicación entre científicos de datos y expertos del dominio. Los widgets de visualización incluyen diagrama de dispersión, diagrama de caja e histograma, y visualizaciones específicas del modelo como dendrograma, diagrama de silueta y visualización de árboles, solo por mencionar algunos. Muchas otras visualizaciones están disponibles en complementos e incluyen visualizaciones de redes, nubes de palabras, mapas geográficos y más.
Nos encargamos de hacer que las visualizaciones de Orange sean interactivas: puede seleccionar puntos de datos de un diagrama de dispersión, un nodo en el árbol, una rama en el dendrograma. Cualquier interacción de este tipo indicará a la visualización que envíe un subconjunto de datos que corresponda a la parte seleccionada de la visualización. Considere la combinación de un diagrama de dispersión y un árbol de clasificación a continuación. El diagrama de dispersión muestra todos los datos, pero resalta el subconjunto de datos que corresponde al nodo seleccionado en el árbol de clasificación.
Grandes visualizaciones
Orange incluye muchas visualizaciones estándar. El diagrama de dispersión es excelente para visualizar correlaciones entre pares de atributos, el diagrama de caja para mostrar estadísticas básicas, el mapa de calor para proporcionar una descripción general de todo el conjunto de datos y los gráficos de proyección como MDS para representar los datos multinomiales en dos dimensiones.
Además de las visualizaciones que uno esperaría en una suite de minería de datos, Orange incluye algunos extras excelentes que quizás no encuentre en otros paquetes. Estos incluyen widgets para el gráfico de silueta para analizar los resultados de la agrupación, el mosaico y el diagrama de tamiz para descubrir las interacciones de las características y la visualización del árbol de Pitágoras para la clasificación de árboles y bosques.
Análisis exploratorio de datos
Las visualizaciones interactivas permiten el análisis exploratorio de datos. Uno puede seleccionar subconjuntos de datos interesantes directamente de diagramas, gráficos y tablas de datos y extraerlos en widgets posteriores. Por ejemplo, seleccione un conglomerado del dendrograma de conglomerados jerárquicos y asígnelo a una presentación de datos 2D en el gráfico MDS. O verifique sus valores en la tabla de datos. O observe la dispersión de sus valores característicos en un diagrama de caja. Abra todas estas ventanas a la vez y vea cómo los cambios en su selección afectan a otros widgets. O, para otro ejemplo, realice una validación cruzada de la regresión logística en un conjunto de datos y asigne algunas de las clasificaciones erróneas a la proyección bidimensional. Es fácil convertir a Orange en una herramienta en la que los expertos del dominio puedan explorar sus datos incluso si carecen de información sobre las estadísticas subyacentes o el aprendizaje automático.
Visualizaciones inteligentes
A veces hay demasiadas opciones. Digamos, cuando los datos tienen muchas características, ¿qué par de características deberíamos visualizar en un gráfico de dispersión para proporcionar la mayor parte de la información? ¡La visualización inteligente viene al rescate! En el gráfico de dispersión de Orange, esto se denomina Gráficos de puntuación. Cuando se proporciona información de clase, Score Plots encuentra proyecciones con la mejor separación de clases. Considere el conjunto de datos seleccionados en marrón (viene con Orange) y sus 79 funciones. Hay 3.081 (79*78/2) pares de características diferentes, demasiados para verificarlos manualmente, pero solo hay unas pocas combinaciones de características que producen un gran gráfico de dispersión. Score Plots los encuentra todos y nos permite navegar a través de ellos.
Informes
Finalmente, podemos incluir las visualizaciones, estadísticas e información más importantes sobre los modelos en el informe con un solo clic. Orange incluye informes inteligentes donde puede acceder al historial de flujo de trabajo para cada widget y visualización directamente desde el informe.
¿Seguimos conversando en nuestras comunidades?
⭐ La comunidad alcanza a +10.300 personas con este newsletter 🚀 Muchos se suscriben desde Linkedin (+3.200), otros por Newsletter (+7.100) y muchos más desde mi Blog. Gracias, gracias y gracias por estar cerca y seguir transformando este mundo para un futuro mejor.
🏅 𝐂𝐨𝐧𝐯𝐢𝐞́𝐫𝐭𝐞𝐭𝐞 𝐞𝐧 𝐦𝐢𝐞𝐦𝐛𝐫𝐨 𝐞𝐱𝐜𝐥𝐮𝐬𝐢𝐯𝐨: Suscríbase para obtener acceso a contenido exclusivo, al newsletter completo de mi contenido exclusivo, sesiones de coaching uno a uno y entrenamientos grupales. Nunca te pierdas una actualización. | 🏅 Quiero ser miembro exclusivo 🚀
☕ ¿𝐌𝐞 𝐢𝐧𝐯𝐢𝐭𝐚𝐬 𝐮𝐧 𝐜𝐚𝐟𝐞́? ¡Ayúdame a ayudarte, para crear contenidos más despiertos! Comunidad de seguidores, mentores y patrocinador de nuestros contenidos para compartir, aprender e inspirar a otros a seguir transformando un mundo para un futuro mejor. | ☕Cafecito | 🥤Coffee | 💲Paypal 🚀
🚀 Si te interesa seguir aprendiendo, compartiendo e inspirando para tu crecimiento personal: 💪 Coaching/Mentoring, 📚 Libros y Papers, 📺 Videos, 🎧 Podcast y 🌎 mucho más…
🔥 𝐍𝐞𝐰𝐬𝐥𝐞𝐭𝐭𝐞𝐫 #𝐌𝐚𝐫𝐭𝐞𝐬𝐂𝐎𝐀𝐂𝐇 🚀 Con lo mejor de mis contenidos, entrevistas y muchos más de las comunidades donde participo... ¿Me ayudas con tu suscripción? 📌 https://www.oscarschmitz.com/recursos/newsletter
📺 Súmate a nuestra 𝐂𝐨𝐦𝐮𝐧𝐢𝐝𝐚𝐝 𝐘𝐨𝐮𝐭𝐮𝐛𝐞 "CXO Communtiy" 🎙️ Con las mejores entrevistas, encuentros y contenidos sobre innovación de los negocios, coaching ejecutivo y tecnologías disruptivas 📌 Canal Youtube https://www.youtube.com/cxocommunity
🚀 Forma parte de nuestra 𝐂𝐨𝐦𝐮𝐧𝐢𝐝𝐚𝐝 𝐋𝐢𝐧𝐤𝐞𝐝𝐢𝐧 "CXO Communtiy | Aprender, Compartir e Inspirar | Propósito Extraordinario" 👁️ Donde compartimos ideas para transformar el mundo en un futuro mejor 📌 Grupo Linkedin https://www.linkedin.com/groups/128190/