economia y tecnologia en Trujillo: Cómo DeepSeek y los agentes de IA de próxima generación podrían erosionar el valor de los modelos lingüísticos

viernes, 31 de enero de 2025

Cómo DeepSeek y los agentes de IA de próxima generación podrían erosionar el valor de los modelos lingüísticos

PUBLICADO EL VIERNES 31 DE ENERO DE 20251:13 A. M., HORA DEL ESTE DE EE. UU.

Ryan Browne @RYAN_BROWNE_

PUNTOS CLAVE

Los ejecutivos de los principales laboratorios de inteligencia artificial dicen que los modelos de lenguaje de gran tamaño como los de OpenAI y las grandes empresas tecnológicas corren el riesgo de convertirse en productos básicos en 2025.
La semana pasada, la empresa china de inteligencia artificial DeepSeek lanzó R1, un modelo de razonamiento que afirma ser mejor y más rentable que el modelo o1 de OpenAI.
Las empresas tecnológicas también están hablando de un cambio de los LLM a los llamados sistemas “agencial” que pueden realizar tareas en su nombre e incorporar estos modelos.

El logotipo de OpenAI se ve en esta ilustración fotográfica el 31 de marzo de 2023 en Varsovia, Polonia. (Foto de Jaap Arriens/NurPhoto vía Getty Images)

Jaap Arriens | NurPhoto vía Getty Images

Modelos de lenguaje de gran tamaño como los desarrollados por MicrosoftLas empresas OpenAI, respaldadas por Microsoft, se convertirán en un producto básico este año en medio de rápidos avances hacia agentes de inteligencia artificial de próxima generación y rivales más ágiles y de código abierto, según los principales ejecutivos tecnológicos.

La semana pasada, la empresa china de inteligencia artificial DeepSeek lanzó R1, un modelo de razonamiento de código abierto que pretende rivalizar con el modelo o1 de OpenAI tanto en cuanto a costo como a rendimiento. El código abierto se refiere a un software cuyo código fuente se pone a disposición de forma gratuita en la web abierta para su posible modificación y redistribución.

Esta semana, la creciente conciencia sobre el nuevo modelo de DeepSeek provocó una fuerte caída en las acciones de Nvidia.y otros gigantes tecnológicos, ya que los inversores temían una posible reducción del gasto en las potentes unidades de procesamiento de gráficos necesarias para entrenar y ejecutar cargas de trabajo de IA avanzadas.

Nvidia perdió cerca de 600 mil millones de dólares en capitalización de mercado el lunes, la mayor caída en un solo día para cualquier empresa en la historia de Estados Unidos.

Mientras tanto, los ejecutivos y científicos de los principales laboratorios de IA están hablando de un cambio desde grandes modelos de lenguaje a los llamados “agentes de IA” que pueden realizar acciones en su nombre.

Los LLM son la tecnología fundamental detrás de las aplicaciones de IA generativa actuales. Sin embargo, los expertos creen que el impulso hacia los sistemas de IA con agentes (que incorporan tecnología LLM) este año erosionará el valor de estos modelos.

Mercantilización de los títulos de LLM

Se espera que los LLM se conviertan en un producto cada vez más común en el futuro cercano a medida que la tecnología se vuelva cada vez más avanzada y los costos involucrados en la capacitación y el funcionamiento sigan disminuyendo.

Thomas Wolf, cofundador y director científico de Hugging Face, sugirió que los LLM se integrarán más en sistemas inteligentes vinculados a las propias bases de datos de la empresa.

“Creo que la gente está dejando atrás esta locura en torno al modelo y comprendiendo que, gracias al código abierto... muchos de estos modelos van a ser gratuitos y estarán disponibles de forma gratuita”, dijo Wolf a la CNBC. Hugging Face es un repositorio de código popular para proyectos de IA de código abierto.

VÍDEO 05:00

Cofundador de Hugging Face: El próximo paso en la IA serán las aplicaciones

“En la revolución de Internet, estamos pasando de crear sitios web como negocio principal a crear empresas nativas de Internet, es decir, el Airbnb de la IA, el Stripe de la IA”, añadió. “No se trata del modelo, sino del sistema y de cómo hacer que el modelo sea útil para las tareas”.

La llegada del modelo R1 de DeepSeek la semana pasada es vista por algunos directores ejecutivos de empresas tecnológicas como un indicador más de que los LLM se están volviendo cada vez más un producto básico.

R1 incorpora algunos aspectos clave que lo diferencian de otros modelos del mercado. Por ejemplo, el modelo incorpora un marco de “precisión mixta” que utiliza una combinación de números de punto flotante de 32 bits de precisión completa (FP32) y números de punto flotante de 8 bits de baja precisión (FP8).

Este último es más rápido de procesar, pero puede ser menos preciso. Sin embargo, en lugar de depender de uno u otro, DeepSeek utiliza FP8 para la mayoría de los cálculos y cambia a FP32 para ciertas tareas en las que se requiere un mayor grado de precisión.

“A medida que la IA se vuelva más eficiente y accesible, veremos que su uso se disparará, convirtiéndola en un producto del que simplemente no podemos tener suficiente”, dijo Microsoft. El director ejecutivo Satya Nadella escribió en la plataforma de redes sociales X, en una aparente referencia a DeepSeek.

Mientras tanto, Matt Calkins, CEO de la empresa de software estadounidense Appian, dijo a CNBC que el éxito de DeepSeek simplemente demuestra que los modelos de IA se convertirán en un producto cada vez más común en el futuro.

“En mi opinión, vamos a ver una mercantilización de la IA. Muchas empresas lograrán una IA competitiva y la falta de diferenciación será perjudicial para las empresas pioneras que gasten mucho”, dijo Calkins por correo electrónico.

¿Qué son los agentes de IA?

En los últimos dos años, gran parte de la atención se ha centrado en los productos impulsados por LLM, desde chatbots de IA generativa como ChatGPT de OpenAI hasta herramientas que pueden producir imágenes y contenido de video.

Las aplicaciones generativas basadas en LLM, como ChatGPT, dependen de un cierto grado de acompañamiento por parte de los usuarios para solicitarles continuamente resultados, mientras que, por el contrario, los agentes de IA están diseñados para estar más orientados a la acción.

Si quisieras reservar una cita con el médico, por ejemplo, podrías pedirle a ChatGPT información sobre los consultorios médicos más cercanos, de forma similar a como consultarías la web usando el motor de búsqueda de Google.

En el futuro, los ejecutivos de tecnología predicen que la próxima generación de IA incluirá agentes que puedan averiguar dónde se encuentra su médico de cabecera más cercano, proporcionar horarios disponibles para su médico y concertarle una cita, todo directamente desde una única plataforma. Se espera que esto transforme la forma en que interactuamos con la web.

“Durante las décadas transcurridas desde que se inventó la web, la interfaz estándar de las páginas web y los menús no ha cambiado mucho”, dijo anteriormente a CNBC Bobby Blumofe, director de tecnología de Akamai.

“Vivimos en una especie de tiranía: estamos atados a una pantalla, a páginas web y menús y tenemos que recordar cómo navegar”.

El paso de los modelos a los agentes

La semana pasada, Arthur Mensch, CEO de Mistral, dijo que cree que “el foco debería desplazarse hacia sistemas” que integren tanto modelos de lenguaje como datos comerciales contextuales.

“Ahí es donde está cambiando la situación”, dijo Mensch a Arjun Kharpal de CNBC en la reunión anual del Foro Económico Mundial en Davos, Suiza.

VÍDEO 06:19

El director ejecutivo de Mistral: “Hemos demostrado que Europa puede desarrollar una tecnología de inteligencia artificial exitosa”

“Esto también significa que la industria que lo está adoptando va a volcar su experiencia en esos sistemas, y ahí es donde será necesario impulsar realmente el valor de la IA en esas industrias”.

Mistral, que cuenta con el respaldo de Microsoft, se ha convertido rápidamente en una de las empresas de inteligencia artificial más importantes de Europa. Fundada hace solo dos años, los inversores la valoraron por última vez en unos 6.000 millones de dólares en junio de 2024.

La tendencia de los agentes ya ha ganado una fuerza considerable. La semana pasada, OpenAI lanzó su propio agente, llamado Operator . OpenAI lo describe como “un agente que puede ir a la web para realizar tareas por usted”, y agrega que está entrenado para interactuar con “los botones, menús y campos de texto que la gente usa a diario” en la web.

Microsoft, que ha invertido miles de millones de dólares en OpenAI, lanzó sus propios agentes de IA en noviembre.

Anthropic, una startup de inteligencia artificial respaldada por Amazon y fundada por ex ejecutivos de investigación de OpenAI, presentó el año pasado el “uso de computadoras”, que es una capacidad que permite a sus agentes de IA usar computadoras como humanos para completar tareas complejas.

Dario Amodei, CEO de Anthropic, dijo a Andrew Ross Sorkin de CNBC en Davos la semana pasada que el uso de la computadora debería considerarse como un precursor de una “visión más amplia” que integre estos agentes con aplicaciones de uso común.

“Estamos planeando este año 2025 construir algo que llamamos ‘colaborador virtual’”, dijo Amodei, describiéndolo como “un agente que opera en su computadora”.

VÍDEO 06:31

El director ejecutivo de Anthropic: “Tenemos más confianza que nunca en que estamos muy cerca de desarrollar potentes capacidades de inteligencia artificial”

“Puedes asignarle tareas. Puedes decirle que escriba esta función para esta aplicación y él escribirá un código, compilará el código, lo revisará, hablará con sus compañeros de trabajo en Slack, en Google Docs o en alguna otra plataforma”, explicó el director de Anthropic.

Anthropic planea desarrollar gradualmente partes de esta visión durante el próximo año, al tiempo que garantiza que sea “segura y controlable”, agregó Amodei.

Paul O’Sullivan, director de tecnología de Salesforce para el Reino Unido e Irlanda, predice que la comunicación verbal cobrará mayor importancia en el nuevo mundo de los agentes de IA. Salesforce fue, sin duda, una de las primeras empresas en sumarse al juego de la IA como agente, ya que lanzó su propio sistema Agentforce en septiembre antes que Microsoft, OpenAI o Anthropic.

“Hablaremos más”, dijo a la CNBC en una entrevista reciente. “Las pantallas serán más pequeñas, nuestra vista empeorará. Pero probablemente serán reemplazadas por dispositivos móviles que sean más potentes que las computadoras portátiles de todos modos”.

economia y tecnologia en Trujillo

Vistas de página en total

viernes, 31 de enero de 2025

Cómo DeepSeek y los agentes de IA de próxima generación podrían erosionar el valor de los modelos lingüísticos

Cómo DeepSeek y los agentes de IA de próxima generación podrían erosionar el valor de los modelos lingüísticos

Mercantilización de los títulos de LLM

¿Qué son los agentes de IA?

El paso de los modelos a los agentes

No hay comentarios:

Publicar un comentario

Datos personales