Nuestro Blog

Para favorecer la recuperación y la transformación del tejido productivo, este fondo fomentará el desarrollo de proyectos digitales de alto impacto y la inversión en empresas en crecimiento mediante el refuerzo de instrumentos públicos de financiación, la atracción de fondos internacionales y la potenciación del capital riesgo.

Esta iniciativa, puesta en marcha a través del Ministerio de Asuntos Económicos y Transformación Digital, busca favorecer la colaboración público-privada y el desarrollo del capital riesgo, con el objetivo de movilizar recursos conjuntos de hasta 4.000 millones de euros.

El Gobierno pone en marcha, a través del Ministerio de Asuntos Económicos y Transformación Digital, el Fondo Next Tech como parte de la Estrategia Nacional de Inteligencia Artificial presentado en diciembre, y dirigido a impulsar el crecimiento de empresas digitales y la inversión en proyectos tecnológicos de alto impacto. Este nuevo mecanismo favorecerá la colaboración público-privada y el desarrollo del capital riesgo, con una partición del Estado en los fondos y empresas de hasta el 49%, lo que permitirá aumentar la capacidad de inversión en empresas y proyectos tecnológicos.

El objetivo de Next Tech, pensado para un plazo inicial de cuatro años, es impulsar el emprendimiento digital y en tecnologías digitales habilitadoras, así como consolidar el crecimiento de empresas altamente innovadoras de base tecnológica. Con ello, fomentar la competitividad, la innovación, la inversión de fondos internacionales y la atracción y retención de talento.

Con este objetivo Next Tech participará en fondos y empresas que desarrollen su actividad en el ámbito digital, en el impulso de proyectos relacionados con la inteligencia artificial, internet de las cosas, tecnologías de procesamiento masivo de datos (big data), computación en la nube (cloud computing), blockchain, procesamiento de lenguaje natural, machine learning, ciberseguridad, biometría e identidad digital y algoritmos verdes, entre otros.

Gracias al Machine Learning es posible realizar tareas de clasificación sobre un conjunto de datos. En el caso de la clasificación automática de documentos se utilizan técnicas de Inteligencia Artificial sobre un conjunto de elementos para ordenarlos por clases o categorías. Sin embargo, también se pueden utilizar estas técnicas para asignar un documento a una determinada clase o categoría.

Para llevar a cabo la clasificación automática de documentos primero hay que realizar una extracción de features (características) destinadas a ser informativos y no redundantes. Esto facilitará los pasos posteriores de machine learning en la clasificación automática de documentos. La extracción de características (features) se trata de un proceso de reducción y codificación, donde un conjunto inicial de variables sin procesar (ej. texto en un documento) se reduce a características más manejables para su procesamiento (ej. números) y que se describa con precisión el conjunto de datos original.

Existen diversas técnicas de extracción de features.

Técnica clásicas:

  • Term frequency – Inverse document frequency (TF IDF). Se trata una técnica muy utilizada en Machine Learning. para otorgar la relevancia de una palabra en un documento de una colección a través de una medida numérica. Esta medida numérica se utiliza para calificar la relevancia de una palabra dentro de un documento a partir de la frecuencia que aparece en el mismo. La idea en la que se basa esta técnica es que si una palabra aparece frecuentemente en el documento, debe ser importante y se le debe dar una puntuación alta. Sin embargo, si una palabra aparece frecuentemente en otros documentos, probablemente no sea un identificador único, y por tanto, se le debe asignar una puntuación más baja. Aquí, puedes consultar la fórmula matemática.

Nuevas técnicas basadas en Deep Learning:

  • Doc2vec. El objetivo principal de Doc2Vec es asociar documentos arbitrarios con etiquetas. Doc2vec es una extensión de word2vec que aprende a correlacionar etiquetas y palabras, en lugar de palabras con otras palabras. El primer paso es crear un vector que represente el «significado» de un documento para que luego se pueda utilizar como entrada a un algoritmo de aprendizaje automático supervisado y así asociar documentos con etiquetas.

Tras la extracción de features y en base a la información previa que se posea de los documentos a clasificar o categorizar, se podrán realizar diversas técnicas para la clasificación automática de documentos:

  • Clasificación supervisada. Cuando tenemos conocimiento del conjunto de documentos previamente clasificados de forma manual, ésto nos servirán para entrenar al sistema inteligente en la clasificación automática.
  • Clasificación no supervisada o clustering de documentos. Cuando no tenemos información a priori del conjunto de documentos ni de las categorías en las que deben estar clasificados.

Cuáles son las técnicas de clasificación automática de documentos más usadas

Según el tipo de clasificación, existen:

  • Técnicas de aprendizaje supervisado para clasificaciones supervisadas. Estas técnicas intentan reducir una función que partiendo de la colección de documentos (clasificación manual), tomando un documento de entrada sea capaz de predecir la clase o categoría a la que corresponde ese documento. En otras palabras, estas técnicas de clasificación supervisadas parten de un conjunto de documentos ya clasificados de forma manual (conjunto de entrenamiento) y se intenta asignar una clasificación a un segundo conjunto de documentos. Dependiendo del tipo de colección de documento o tipo de documentos a clasificar, se utilizarán unas técnicas u otras, desde algoritmos de clasificación bayesianos, arboles de decisiones, redes neuronales, …
  • Algoritmos de clustering para clasificaciones no supervisadas. Cuando no se disponen de un conjunto de documentos previamente clasificados, se opta por, a partir de las propiedades de los documentos, agruparlos (clustering) según sus semejanzas entre sí.

¿Qué herramienta puedes utilizar para clasificar tus archivos de forma automática?

En ITELLIGENT, hemos desarrollado una plataforma basada en Inteligencia Artificial (IA) que permite automatizar tareas relacionadas con gestión y clasificación de documentos, contenidos multimedia y archivos con otros formatos poco estructurados. Gracias a técnicas de IA y Procesamiento de Lenguaje Natural, esta plataforma permite extraer e indexar datos además de descubrir conocimiento y detectar oportunidades.

Se trata de la plataforma netContent y dispone de un acceso para que el cliente pueda realizar diversas gestiones tales como gestionar las reglas a aplicar, habilitar accesosa otros usaurios, supervisar documentos o tener acceso a dashboards con métricas del sistema, según las necesidades de cada empresa.

NetContent-dashboard-2019

Además, permite volcar el resultado de la gestión documental en los sistemas de gestión que utilices, ya sa Sharepoint, Thinkproject, etc. En resumen, gracias a esta plataforma se puede hacer lo siguiente:

  • Clasificación automática de documentos
  • Indexación de audios  de vídeos y/o podcasts
  • Obtención de texto procedentes de documentos escaneados (OCR)
  • Obtención de tags de imágenes
  • Extracción de textos y metadatos de documentos en distintos formatos
  • Indexación avanzada de textos e imágenes
  • Descubridor de conocimiento
  • Detección de oportunidades

netContent se adapta a las necesidades de cada cliente y posee otras funcionales tales como:

  • Early Warning System, para la detección temprana de oportunidades a partir de bots de búsqueda de oportunidades potenciales y su evaluación  utilizando técnicas de Inteligencia Artificial
  • La gestión documental de estas oportunidades detectadas y su vuelco en el sistema de gestión documental del cliente, si hubiere
  • Asimismo, esta gestión documental servirá para re-alimentar los modelos de Inteligencia Artificial del Early Warning System

Las cookies parecen tener los días contados, el sistema de rastreo utilizado hasta ahora por la industria de la publicidad online encuentra cada vez  más barreras. Sin embargo, el nuevo sistema de Google permitirá que veamos anuncios personalizados en Internet sin necesidad de estar ofreciendo nuestro histórico de navegación a terceros.

Hoy en día, las personas quieren garantías de que su identidad e información estén seguras mientras navegan por la web. Es por eso que Google Chrome presentó, en su camino para eliminar las cookies de terceros, algunas alternativas viables de privacidad desarrolladas junto con socios del ecosistema, para ayudar a anunciantes a tener éxito al mismo tiempo que se protege la privacidad de las personas en su navegación en la red.

Es dificil de imaginar cómo la publicidad online puede ser posible de medir con precisión sin cookies de terceros. Cuando la tecnología «Privacy Sandbox» basada en intereses se propuso por primera vez el año pasado, fue cuando se comenzó a trabajar con la idea de que grupos de personas con intereses comunes podrían reemplazar los identificadores individuales. Este año, Google ha publicado nuevos datos que muestran cómo esta innovación puede ofrecer resultados casi tan efectivos como los enfoques basados ​​en cookies. Este avance tecnológico  de FLoC (Federated Learning of Cohorts), segun Google, es el futuro de la publicidad online junto a la tecnologia «Privacy Sandbox».

Publicidad basada en intereses

Federated Learning of Cohorts o el aprendizaje federado de cohortes (FLoC) propone una nueva forma para que las empresas lleguen a las personas con contenido y anuncios relevantes agrupando grandes grupos de personas con intereses similares. Este enfoque oculta efectivamente a las personas «entre la multitud» y utiliza el procesamiento en el dispositivo para mantener en privado el historial web de una persona en el navegador.

Al crear simulaciones basadas en los principios definidos en la propuesta de FLoC de Google Chrome, los equipos de Google Ads han probado esta alternativa de privacidad en primer lugar a las cookies de terceros. Los resultados indican que cuando se trata de generar audiencias basadas en intereses, FLoC puede proporcionar una señal de reemplazo efectiva para las cookies de terceros. Estas pruebas de FLoC para alcanzar audiencias de Google afines y en el mercado, muestran que los anunciantes alcanzar, al menos, el 95% de las conversiones por dólar gastado, frente a la publicidad basada en cookies. El resultado depende de: la fuerza del algoritmo de agrupación en clústeres que utiliza FLoC y del tipo de audiencia a la que se llega.

Creación de audiencia propias, sin el uso de cookies de terceros.

Chrome ha publicado una nueva propuesta llamada FLEDGE que está diseñado específicamente para almacenar información sobre las ofertas y los presupuestos de una campaña. Chrome tiene la intención de hacer que FLEDGE esté disponible para pruebas a través de pruebas de origen a finales de este año con la oportunidad para que las empresas de tecnología publicitaria intenten usar la API bajo un modelo de «traer su propio servidor».

Si bien propuestas como FLoC y FLEDGE exploran alternativas que preservan la privacidad para llegar a audiencias relevantes, también se está trabajando para ayudar a los compradores a decidir cuánto ofertar por los anuncios vistos por estas audiencias.

Medida de conversión, medir el rendimiento de la campaña sin cookies de terceros.

Al utilizar técnicas de preservación de la privacidad como agregar información, agregar ruido y limitar la cantidad de datos que se envían desde el dispositivo, las API propuestas informan las conversiones de una manera que protege la privacidad del usuario. Por ejemplo, una iteración de la API a nivel de evento está disponible actualmente en las pruebas de origen para medir las conversiones de clic. Protege la privacidad al introducir ruido y limitar los bits de datos de conversión que la API puede enviar a la vez. Como resultado, los anunciantes deberán priorizar qué conversiones son más importantes para sus necesidades de generación de informes.

Durante los próximos meses, los equipos de anuncios de Google seguirán evaluando cómo se pueden utilizar las API de medición de conversiones propuestas junto con los productos de medición de Google para respaldar casos de uso, como informar conversiones posimpresión, determinar la incrementalidad y el alcance, así como realizar la atribución.

Sin embargo, una propuesta con cierta polémica

Algunos organismos reguladores en Alemania, Francia, Bélgica e Irlanda están examinando esta propuesta de Google con respecto a la legislación que rige en Europa sobre la protección de datos o GDPR de la ciudadanía. Incluso algunas empresas, se posicionan en contra de FLoC. Os dejamos el siguiente vídeo de ComputerHoy.com donde lo explican a la perfección:

¿Quieres saber más cómo funciona FLoC?

Google Developers Latam, en su blog, publican sobre qué es el aprendizaje federado de cohortes, cómo funciona y cómo hace el servicio FLoC para permitir que el navegador determinar su cohorte, entre otros recursos para desarrolladores.

Fuente: Google Blog