Editor en La Ecuación Digital. Consultor de Innovación y Estrategia…
Oracle ha anunciado hoy la disponibilidad de Oracle Cloud Data Science Platform. El núcleo es Oracle Cloud Infrastructure Data Science, que ayuda a las empresas a crear, entrenar, administrar e implementar modelosde aprendizaje automático de forma colaborativa para aumentar el éxito de los proyectos de ciencia dedatos. A diferencia de otros productos de ciencia de datos que se centran en científicos de datos individuales, Oracle Cloud Infrastructure Data Science ayuda a mejorar la eficacia de los equipos de ciencia de datos con capacidades como proyectos compartidos, catálogos de modelos, políticasy de seguridad de equipo, reproducibilidad y auditabilidad. Oracle Cloud Infrastructure Data Science selecciona automáticamente los conjuntos de datos de entrenamiento más óptimos a través de la selección y ajuste de algoritmos AutoML, la evaluación de modelos y la explicación del modelo.
Hoy en día, las organizaciones se dan cuenta de solo una fracción del enorme potencial transformador de los datos porque los equipos de ciencia de datos no tienen fácil acceso a los datos y herramientas adecuados para crear e implementar modelos de aprendizaje automático eficaces. El resultado neto es que los modelos tardan demasiado en desarrollarse, no siempre cumplen con los requisitos empresariales de precisión y robustez y con demasiada frecuencia nunca entran en producción.
«Los modelos eficaces de aprendizaje automático son la base de proyectos exitosos de ciencia de datos, pero el volumen y la variedad de datos que enfrentan las empresas pueden detener estas iniciativas antes de que deshaganse», dijo Greg Pavlik, vicepresidente sénior de desarrollo de productos de Oracle Data y AI Services. «Con Oracle Cloud Infrastructure Data Science, estamos mejorando la productividad de los científicos de datos individuales mediante la automatización de todo su flujo de trabajo y la adición de un sólido soporte de equipo para la colaboración para ayudar a garantizar que los proyectos de ciencia de datos ofrezcan valor real a las empresas».
Diseñado para equipos de ciencia de datos y científicos
Oracle Cloud Infrastructure Data Science incluye un flujo de trabajo de ciencia de datosd automatizado, ahorrando tiempo y reduciendo errores con las siguientes capacidades:
- La selección y ajuste automatizado de algoritmos AutoML automatiza el proceso de ejecución de pruebas con múltiples algoritmos y configuraciones de hiperparámetros. Comprueba la precisión de los resultados y confirma que el modelo y la configuración óptimos están seleccionados para su uso. Esto ahorra mucho tiempo a los científicos de datos y, lo que es más importante, está diseñado para permitir que todos los científicos to de datos logren los mismos resultados que los profesionales más experimentados.
- La selección automatizada de características predictivas simplifica la ingeniería de características al identificar automáticamente las entidades predictivas clave de conjuntos de datos más grandes.
- La evaluación de modelos genera un conjunto completo de métricas de evaluación y visualizaciones adecuadas para medir el rendimientodel modelo con respecto a los nuevos datos y puede clasificar modelos a lo largo del tiempo paralograr un comportamiento óptimo en producción. La evaluación del modelo va más allá del rendimiento sin procesar para tener en cuenta el comportamiento de línea base esperado y utiliza un modelo de coste para que los diferentes impactos de falsos positivos y falsos negativos se puedan incorporar completamente..
- Explicación del modelo: Oracle Cloud Infrastructure Data Science proporciona una explicación automatizada de la ponderación relativa y la importancia de los factores que se generan en la generación de una predicción. Oracle Cloud Infrastructure Data Science ofrece la primera implementación comercial de una explicación independiente del modelo. Con un modelo de deteccióndefraude, por ejemplo, un científico de datos puede explicar qué factores son los mayores impulsores del fraude para que el negocio pueda modificar procesos o implementar salvaguardias..
Conseguir modelos de aprendizaje automático eficaces con éxito en la producción necesita algo más que individuos dedicados. Requiere equipos de científicos de datos que trabajen juntos de forma colaborativa. Oracle Cloud Infrastructure Data Science ofrece potentes capacidades de equipo que incluyen:
- Los proyectos compartidos ayudan a los usuarios a organizar, encontrolar la versión y compartir de forma fiable el trabajo de un equipo, incluidas las sesiones de datos y portátiles.
- Los catálogos de modelos permiten a los miembros del equipo compartir de forma fiable los modelos ya compilados y los artefactos necesarios para modificarlos e implementarlos.
- Las políticas de seguridad basadas en equipos permiten a los usuarios controlar el acceso a modelos, código y datos, que están totalmente integrados con Oracle Cloud Infrastructure Identity and Access Management.
- Las funciones de reproducibilidad y auditabilidad ies pueden a la empresa realizar un seguimiento de todos los activos relevantes, de modo que todos los modelos puedan ser reproducidos y auditados, incluso si los miembros del equipo se van.
Con Oracle Cloud Infrastructure Data Science, las organizaciones pueden acelerar la implementación exitosa del modelo y producir resultados y rendimiento de nivel empresarial para el análisis predictivo con el fin de impulsar resultados empresariales positivos.
Servicios integrales de datos y aprendizaje automático
Oracle Cloud Data Science Platform incluye siete nuevos servicios que hat ofrecen una experiencia integral completa diseñada para acelerar y mejorar los resultados de la ciencia de datos:
- Oracle Cloud Infrastructure Data Science: permite a los usuarios crear, entrenar y administrar nuevos modelosde aprendizaje automático en Oracle Clou mediante Python y otras bibliotecas y herramientas de código -abierto, como TensorFlow, Keras y Jupyter.
- Nuevas y potentes capacidades de aprendizaje automático en Oracle Autonomous Database: losalgoritmos de aprendizaje automático están estrechamente integrados en Oracle Autonomous Database con nuevo soporte para Python y aprendizaje automático automatizado. La próxima integración con Oracle Cloud Infrastructure Data Science permitirá a los científicos de datos desarrollar modelos utilizando algoritmos de código abierto y escalables en la base de datos. De forma única, llevar algoritmos a los datos de Oracle Database acelera el tiempo de resultados al reducir la preparación y el movimiento de los datos.
- Oracle Cloud Infrastructure Data Catalog: permite a los usuarios descubrir, buscar, organizar, enriquecer y rastrear activos de datos en Oracle Cloud. Oracle Cloud Infrastructure Data Catalog tiene un glosario empresarial integrado que facilita la curación y la detección de los datos de confianza adecuados.
- Oracle Big Data Service: Ofrece una implementación completa de Cloudera Hadoop, con una administración mucho más sencilla que otras ofertas de Hadoop, que incluye un solo clic para hacer que un clúster esté altamente disponible e implementar la seguridad.ity Oracle Big Data Service también incluye aprendizaje automático para Spark, lo que permite a las organizaciones ejecutar Spark machine learning en memoria con un solo producto y con un movimiento de datos mínimo.
- Oracle CloudSQL: habilita las consultas SQL en datos en HDFS, Hive, Kafka, NoSQL y almacenamiento de objetos. Solo CloudSQL permite que cualquier usuario, aplicación o herramienta de análisis que pueda hablar con Oracle databases trabaje de forma transparente con datos en otros almacenes de datos, con la ventaja de un procesamiento push-down y escalado horizontal para minimizar el movimiento de datos.
- Oracle Cloud Infrastructure Data Flow: Un servicio de Big Data totalmente administrado que permite a los usuarios ejecutar aplicaciones Apache Spark sin infraestructura para implementar oadministrar. It permite a las empresas entregar aplicaciones deBig Data e IA más rápido. A diferencia de los servicios de Hadoop y Spark de la competencia, Oracle Cloud Infrastructure Data Flow incluye una única ventana para realizar un seguimiento de todos los trabajos de Spark, lo que facilita la identificación de tareas costosas o la solución de problemas.
- Máquinas virtuales de Oracle Cloud Infrastructure para ciencia de datos: entornos preconfigurados basados en GPU con IDE, blocs de notas y marcos comunes que pueden estar en funcionamiento en menos de 15 minutos, por 30 USD al día.
Lo que dicen los clientes
AgroScout se dedica a detectar enfermedades de cultivos en etapatempranas para mejorar el rendimiento de los cultivos, reducir el uso de pesticidas y aumentar los beneficios. «Nuestra visión es hacer que la agronomía moderna sea económicamente accesible para los 1.000 millones de agricultores que trabajan en 500 millones def armas en todo el mundo, lo que constituye el 30 por ciento de la fuerza laboral mundial. Planeamos lograr esto ofreciendoa lanube, AI-driven sustainable unagronomía, confiando puramente en la entrada de drones de bajo costo, teléfonos móviles e insumos manuales por parte de los cultivadores», dijo Simcha Shore, Fundador y CEO AgroScout. «El éxito de esta visión se basa en la capacidad degestionar un flujo continuo y creciente de datos de entrada y nuestra propia solución basada en IA para transformar esos datos enagricultura precisa y de desarrollo, aescala. La velocidad, la escala y la agilidad de Oracle Cloud nos han ayudado a realizar nuestro sueño. Ahora,, se han abierto nuevos horizontes con la reciente incorporación de Oracle Cloud Infrastructure Data Science que mejorala capacidad de nuestros científicos de datos para crear, entrenar y d modelos de aprendizaje automático de formacolaborativa. Esta adición ha reducido los costos, ha aumentado la eficiencia y nos ha ayudado a aumentar nuestra huella global más rápidamente».
IDenTV proporciona análisis de vídeo avanzados basados en capacidades de IA basadas en visión computarizada, reconocimiento de voz automatizado y clasificadores semánticos textuales. «Con Oracle Cloud Infrastructure Data Science, somos capaces de escalar nuestros esfuerzos de ciencia de datos para ofrecer valor empresarial más rápido que nunca. Nuestros equipos de ciencia de datos ahora pueden acceder sin problemas a los datos sin preocuparse por las complejidades de las ubicaciones de datos o los mecanismos de acceso. Al utilizar capacidades de código abierto como los portátiles TensorFlow, Keras y Jupyter integrados en el entorno, podemos agilizar nuestras tareas de entrenamiento e implementación de modelos, lo que resulta en enormes ahorrosy resultados más rápidos», dijo Amro Shihadah, F ounder y COO,, IDenTV.. «Creemos que Oracle Cloud Infrastructure Data Science junto con los beneficios de Autonomous Database nos dará la ventaja que necesitamos para ser competitivos y únicos en el mercado.. «