Estrategia de Plataforma de Datos Moderna de Oracle: Autónoma, Integrada y Segura
No es difícil enumerar los principales impulsores y requisitos de la TI contemporánea. Reúne a cualquier grupo de CIOs y seguramente tu pizarra pronto contendrá algo como: modelos híbridos/multi-nube, como servicio y on-demand, ciberseguridad, DevOps, experiencia del colaborador y del cliente, operaciones autónomas, flexibilidad de las aplicaciones, integración, etc.
Sin embargo, más allá de ello, todos reconocerán rápidamente que los datos son la base de todo. Lo llamarán el ADN de sus empresas, el nuevo petróleo global, sus joyas de la corona empresarial, o algo así. Pero éste es uno de los principales desafíos a los que se enfrenta el departamento de TI hoy en día, o probablemente el más importante.
Todos esos prerrequisitos de la TI se desarrollan invariablemente de forma aislada y sólo se superponen después, todo ello mientras se intenta gestionar el crecimiento exponencial de los datos. Esto significa que, a pesar de la aceptación categórica de la importancia primordial de los datos, las estrategias tradicionales en torno a ellos se desarrollan con demasiada frecuencia de forma aislada y, por lo tanto, no están estrechamente integradas, lo que obliga a utilizar lo equivalente a «tiritas» para solucionar el hecho de que no fueron diseñadas para trabajar juntas desde el principio.
Sencillamente, es poner el carro delante de los bueyes. O centrarse en la herramienta en lugar de en el trabajo.
Es la razón por la que podemos acabar proliferando ciegamente nuevas bases de datos, herramientas, aplicaciones o enfoques de propósito único, asumiendo erróneamente que «nuevo» equivale a «mejor». De hecho, ¿por qué asumimos que «la nube» equivale a «moderno» y «excelente» cuando muy a menudo sólo se trata de trasladar lo que ya hacemos, y cómo lo hacemos, a un lugar diferente?
Las organizaciones pueden caer en la trampa de creer que simplemente migrar a la nube permitirá un «futuro impulsado por datos». Trasladarse a la nube en cierta medida puede ser necesario para el éxito, pero ciertamente no es probable que sea suficiente. En lugar de un destino empresarial ideal, la nube puede acabar siendo el principio de una trayectoria compleja.
Lo que claramente sería mejor es un conjunto de soluciones, aplicaciones y capacidades de TI que se basen en una basede datos integrada y flexible, una descripción que se ajuste perfectamente a la estrategia global de plataforma de datos moderna de Oracle. Desde el consumo hasta la seguridad y la protección de datos, pasando por todo tipo de nubes,
aplicaciones y cargas de trabajo, la estrategia de plataforma de datos moderna de Oracle reúne todo lo relacionado con los datos y en torno a ellos, con un ecosistema de datos completo e integrado de aplicaciones, capacidades de desarrollo y herramientas de gestión de datos (incluida la base de datos autónoma convergente de Oracle y el servicio de base de datos MySQL con HeatWave).
Este es un enfoque lógico e ideal para simplificar no sólo el ciclo de vida de los datos, sino también la velocidad, la eficacia y la amplitud de una plataforma de inteligencia fluida y estrechamente alineada que maneja múltiples cargas de trabajo, tipos de datos y modelos. En términos sencillos, el enfoque de base de datos convergente y centrado en datos de Oracle con Autonomous Database ayuda a proporcionar la conexión más corta entre las responsabilidades de TI y su éxito. Otros proveedores pueden «arreglar» una u otra área de TI, y si se miran de forma aislada, pueden llevar a cabo un gran trabajo en un caso de uso concreto o con herramientas individuales de seguridad, almacenamiento o desarrollo de aplicaciones, o quizás con la continuidad del negocio, un servicio de nube de blockchain
o lo que sea, pero luego corresponde a las empresas de TI (ya sea de forma local o en la nube) montar las piezas, y la falta de una base de datos integrada y completa simplemente hace que desarrollar cosas sea más difícil, menos eficiente o casi imposible.
Otros proveedores de la nube ofrecen un sinfín de servicios 1 para satisfacer una gran cantidad de requisitos y demandas de bases de datos y datos. Sin embargo, la gestión de servicios tan dispares puede plantear desafíos evidentes e ineficiencias operativas.
Un ejemplo del alcance de la complejidad potencial se muestra en el diagrama adyacente, que no es una experiencia poco común para las grandes organizaciones que dependen de varios tipos de bases de datos (e invariablemente incluso más instancias de bases de datos) para satisfacer todos sus diversos requisitos de unidades de negocio y datos. Encima de estos servicios de datos dispares se encuentran los servicios necesarios para garantizar los flujos de datos adecuados con diferentes servicios de procesamiento de datos y ETL.
Obsérvese que, en algunos casos, ciertos servicios de bases de datos ni siquiera pueden conectarse al almacén de datos, lo que obliga a las organizaciones a depender de otras integraciones que introducen costos, complejidad, latencia y riesgos innecesarios.
Adoptar un enfoque multi-herramienta para intentar construir por sí mismo una base de
datos convergente es análogo a pedir a un propietario que necesita luz que descubra cómo construir y operar una red eléctrica en lugar de limitarse a pulsar un interruptor de luz.
1 AWS, por ejemplo, enumera 11 en su sitio web, además de una serie de servicios ETL.
La mayoría de los proveedores de la nube estarían de acuerdo en que el primer paso para analizar eficazmente cantidades masivas de datos dispares es consolidarlos todos en un almacén de datos empresarial (EDW, Enterprise Data Warehouse, en ingles) en la nube. El enfoque de la plataforma de datos integrada de Oracle (que se resume en el siguiente gráfico) lo hace de forma inherente y, por tanto, da prioridad a la eficiencia y la simplicidad operativa.
¿Por qué exigir al ya sobrecargado personal que gestione servicios de datos dispares cuando una base de datos convergente puede ofrecer la simplicidad y eficiencia de gestión deseada por todos los equipos de TI y de datos?
El enfoque de la base de datos convergente de Oracle es tanto multimodelo (con soporte nativo para diferentes tipos de datos, como relacional, OLAP, JSON, espaciales, blockchain, y más) como multicarga de trabajo (con optimizaciones para diferentes casos de uso como analítica, gestión de documentos, machine learning, análisis de gráficos, etc.). Con su servicio de base de datos MySQL con HeatWave, Oracle combina eficazmente todos los casos de uso de la analítica en un único almacén de datos en la nube y puede ofrecer más desempeño a menor costo que la competencia.2 Y, con su base de datos autónoma, combina eficazmente decenas de servicios de bases de datos en una sola entidad que opera por sí misma. El hecho de que todos estos datos residan en una
base de datos común proporciona muchas ventajas, entre ellas:
• Reducción de costos: sólo es necesario instalar y mantener una única base de datos, ya que Oracle proporciona capacidades de machine learning y gráficos de propiedades integradas en la base de datos.
• Mayor desempeño: los datos están disponibles de inmediato y no hay retrasos debidos a la transferencia y transformación de los mismos.
• Mayor confiabilidad: los datos se almacenan en Autonomous Data Warehouse, un almacén autorreparable, lo que proporciona una protección automatizada contra el tiempo de inactividad con un SLA del 99,995%. Además, la eliminación de la gestión manual, las transferencias de datos y la manipulación de los mismos garantiza que ningún error afecte al flujo de datos.
• Mayor seguridad: una única base de datos significa un contagio de copias limitado, menos puntos de vulnerabilidad y exposición, un mayor cumplimiento de la normativa sobre privacidad de datos y un modelo de seguridad unificado.
Gestión simplificada: la administración de una única base de datos para todas las cargas de trabajo reduce la complejidad de la gestión y el número de conjuntos de habilidades diferentes necesarios.
• Rápida implementación: los desarrolladores no necesitan escribir código para integrar los datos de varias fuentes o propagarlos por numerosos sistemas.
La lógica de la estrategia de plataforma de datos integral de Oracle es convincente. A continuación, examinaremos tres áreas en las que la estrategia diferenciada de Oracle ayuda a optimizar al departamento de TI de forma más amplia.
En la actualidad, los sistemas de datos son más pasivos que activos. Los clientes almacenan los datos en determinados locales y, cuando desean consultarlos para obtener información, hacen una pregunta. Si no hacen la pregunta de la forma correcta, no obtendrán la respuesta que buscan o, peor aún, obtendrán la respuesta equivocada.
Con la cantidad de datos, y el ritmo al que se generan, puede ser parecido a encontrar una aguja en un pajar (quizás más apropiado, es como buscar un «objeto puntiagudo, potencialmente metálico» en un apilamiento de hierbas y trigo amontonados).
Otra dimensión de este desafío es la naturaleza dinámica y la variedad de los datos. Hoy en día, las empresas se ven obligadas a observar sus datos y tratar de identificarlos. ¿Dónde están? ¿Qué sistema o aplicación es más adecuado para almacenar y
analizar estos datos? Esto ha dado lugar a una proliferación desmesurada de bases de datos, herramientas y servicios para satisfacer un sinfín de casos de uso en toda la empresa, lo que ha provocado cargas operativas (como el ETL, que implica
trasladar y reformatear los datos de una base de datos o herramienta a otra) que crean cuellos de botella en todo el ciclo de vida de los mismos. Las empresas necesitan ayuda para controlar la complejidad de un ecosistema de datos dinámico con el fin de ofrecer más valor a la empresa con mayor rapidez.
El enfoque de Oracle consiste en simplificar el ciclo de vida de la gestión de datos, desde la recopilación y la integración hasta el conocimiento, con una «lake house» que combine un data lake y un almacén de datos junto con un catálogo de datos de apoyo, servicios de integración de datos y servicios de código abierto gestionados, incluidos Apache Spark y Apache Hadoop. Tanto el data lake como la base de datos convergente admiten múltiples tipos de datos y diferentes cargas de trabajo, por lo que las empresas no tienen que diseñar un sistema diferente para cada tipo de datos y carga de trabajo.
Los datos se almacenan donde tiene sentido en función del caso de uso, el valor de los datos y las herramientas que se utilizan actualmente para procesarlos, y pueden trasladarse fácilmente de acuerdo a las necesidades. Los científicos de datos y los analistas de negocio podrán acceder a cualquier dato que necesiten para desarrollar modelos de machine learning o elaborar informes adecuados, utilizando las herramientas comerciales o de código abierto de su elección. La intención de Oracle es librar a las empresas de la carga de acceso a los datos, colocándolos en el lugar adecuado y dejando que el sistema avance con el tiempo para satisfacer las necesidades cambiantes del negocio (escala, desempeño, etc.), independientemente del tipo de datos, el modelo o la carga de trabajo.
Tanto si se trata de un data center tradicional como de uno en la nube (on-premises o off-premises), el hecho es que los departamentos de TI se están volviendo demasiado grandes y complejos, y los requisitos empresariales se mueven con demasiada rapidez, que se vuelve realmente difícil controlar la gestión y las operaciones.
Sin duda, el traslado a todo tipo de operaciones en la nube ha sido rápido y significativo, pero cualquier suposición de que las operaciones en la nube confieren intrínsecamente un grado de control optimizado que no es posible en las instalaciones es simplemente errónea.
La razón principal por la que el traslado a la nube no es una panacea para los problemas de TI es que la escala, el crecimiento y la variedad de los datos no cambian. Las bases de datos, el almacenamiento, las aplicaciones, los contenedores y las máquinas virtuales son, al mismo tiempo, recipientes de datos y herramientas que permiten mejorar la centralidad de los mismos, pero deben trabajar juntos.
Existen más aplicaciones, más personas y más datos distribuidos en entornos dinámicos (en la nube y tradicionales), y todo ello requiere experiencia para gestionar, mantener, optimizar y proteger. La presión sobre los equipos de operaciones para garantizar la accesibilidad, el desempeño, la seguridad y la confiabilidad de las aplicaciones centradas en los datos nunca ha sido mayor. Además, la mayoría de las personas sigue operando en la nube de forma casi idéntica a como lo hacen/han hecho on-premises. Ponen un recuadro alrededor de los requisitos de su aplicación, seleccionan una «talla» basada en los requisitos de recursos existentes (o, más a menudo, en los picos estimados), y esencialmente sólo cambian esa talla cuando su carga de trabajo llega a un cuello de botella. Lo mismo ocurre con el ajuste de la base de datos.
Se lleva a cabo cuando la base de datos se configura por primera vez, y se deja sola hasta que el desempeño choca con un muro.
Aunque los proveedores de la nube muestran avances al ofrecer recursos adecuados a través de modelos de consumo de plataforma como servicio y servicios gestionados, la necesidad de un replanteamiento fundamental de la plataforma de datos de una empresa es cada vez más evidente. La automatización es un primer paso para eliminar las tareas repetitivas pero, por sí sola, no es suficiente para satisfacer las elevadas expectativas de las empresas.
Oracle reconoce que es incorrecta la suposición de que las empresas tienen suficiente personal para gestionar toda la planificación, las tareas, los desafíos y los problemas relacionados con la infraestructura. En otras palabras, no hay suficientes expertos para gestionar miles de sistemas y el crecimiento exponencial de los datos. La complejidad de la gestión y el mantenimiento de entornos diversos y dinámicos está más allá de la capacidad de comprensión de cualquieri ndividuo. Para lograr la deseada mejora acelerada de la gestión y las operaciones, que es cada vez más la norma y no la excepción, Oracle está impulsando el paso de la automatización a la autonomía como principio fundacional de su emblemática base de datos autónoma.
El enfoque de Oracle sobre su moderna plataforma de datos considera que la nube tiene un papel diferente al de su competencia. No cree en el hecho de poner cargas operativas en el limitado número de expertos técnicos que intentan gestionar, escalar, ajustar, parchear o actualizar manualmente la infraestructura subyacente. No cree en poner límites a las aplicaciones y cargas de trabajo. Oracle cree en dejar que el sistema aprenda sobre las cargas de trabajo, evolucione según sea necesario y resuelva sus necesidades de recursos por sí mismo.
Prácticamente todos los sectores se benefician de la IA y el ML incorporados, así que ¿por qué debería ser diferente la gestión de la infraestructura de datos? Oracle Cloud Infrastructure se basa en la inteligencia incorporada para adaptarse de forma autónoma. Recomienda, aumenta o disminuye la escala, se autocorrige, se autoasegura y se autoajusta, librando a los expertos técnicos de las continuas cargas operativas.
Puede que la ciberseguridad esté en la mente de todos los informáticos, pero a menudo se trata tanto de las incómodas compensaciones que exige como de cualquier garantía de seguridad de los datos. Las empresas se ven obligadas a equilibrar continuamente la seguridad de los datos y el riesgo empresarial; las infracciones siempre le ocurrirán a alguien o en el futuro.
Mientras tanto, pueden optar por no implementar un parche profundo en el sistema porque requerirá un reinicio y tiempo de inactividad, que son inaceptables para el negocio (y garantizan un impacto negativo inmediato). La privacidad, la sensibilidad y la protección de los datos son importantes, ya sea por razones comerciales, por decencia común o por cumplimiento de la normativa.
No es realista dar carta blanca a una nube pública en la que los usuarios están tradicionalmente por su cuenta (como lo estarían on-premises) utilizando herramientas y técnicos puntuales para asegurar que los datos están protegidos, enmascarados, etc.
El enfoque de Oracle sobre la seguridad de los datos es sencillo y atractivo: hacer que la funcionalidad sea uniforme, integral, integrada y autónoma. Tanto para los usuarios como para las organizaciones de TI, esto hace que la seguridad sea invisible y esté siempre activa y, como resultado, las compensaciones de riesgo desaparecen esencialmente. Mantiene los datos protegidos, asegurados y accesibles desde el momento en que llegan; realiza un seguimiento automático de quién accede a qué y realiza cambios; y automatiza la aplicación de parches en caliente para evitar que se produzcan compensaciones entre la seguridad actualizada, la protección de los datos y la disponibilidad de las aplicaciones.
En pocas palabras, es seguridad sin la carga de trabajo técnico continuo, ya que el sistema es responsable de forma autónoma.
Una estrategia global de gestión de datos convincente y valiosa no consiste, en última instancia, en cuántos petabytes se pueden almacenar o cuán rápido se pueden mover. Se trata de tener de forma ideal (eficiente, independiente y segura) todos sus datos integrados, disponibles, accesibles y utilizables, independientemente de en qué lugar del ecosistema de la nube híbrida se encuentren y de cómo o por quién/qué se utilicen.
El ADN original de Oracle se centra en las bases de datos para aplicaciones de misión crítica, más que en la infraestructura subyacente. Esto difiere de gran parte de su competencia, lo que explica su enfoque centrado en los datos. Mientras que otros proveedores de bases de datos en la nube (como Amazon y Snowflake, pero también muchos otros) siguen un camino de bases de datos en la nube especializadas,
Oracle ofrece en cambio una plataforma de datos en la nube integrada que amplía y complementa su base de datos principal y la ha ampliado mucho más allá de ser convergente. Es independiente, flexible, segura y est disponible on-premises o en la nube utilizando Oracle Exadata (su plataforma de base de datos Oracle de alto desempeño que incorpora características únicas no disponibles en otros lugares) o su servicio de base de datos MySQL con HeatWave para cargas de trabajo OLAP y OLTP de MySQL de rápido crecimiento.
De hecho, aunque el término más tradicionalmente asociado a Oracle hasta la fecha ha sido el de «base de datos», si observamos su moderna plataforma de datos, es muy probable que la visión de la historia futura haga hincapié en el término «centrada en datos» como la principal contribución de Oracle al sector.