Sam Altman: Openai ha estado en el ‘lado equivocado de la historia’ sobre el código abierto
Para limitar un día de lanzamientos de productos, investigadores, ingenieros y ejecutivos de Operai, incluido el CEO de OpenAI, Sam Altman, respondieron preguntas en un amplio Reddit AMA el viernes.
OpenAi La compañía se encuentra en una posición un poco precaria. Está luchando contra la percepción de que está cediendo terreno en la carrera de IA para Empresas chinas como Deepseekque Operai alega que podría haber robado su IP. El creador de chatgpt ha estado tratando de apuntalar su relación con Washington y simultáneamente perseguir un Proyecto de centro de datos ambiciosomientras que se informa poner en marcha para una de las rondas de financiación más grandes de la historia.
Altman admitió que Deepseek ha disminuido el liderazgo de OpenAi en la IA, y también dijo que cree que OpenAi ha estado “en el lado equivocado de la historia” cuando se trata de obtener sus tecnologías abiertas. Si bien OpenAI tiene modelos de código abierto en el pasado, la compañía generalmente ha favorecido un enfoque de desarrollo de código cerrado patentado.
“(Personalmente creo que necesitamos) encontrar una estrategia de código abierto diferente”, dijo Altman. “No todos en OpenAI comparte esta opinión, y tampoco es nuestra más alta prioridad actual (…) produciremos mejores modelos (en el futuro), pero mantendremos menos liderazgo que en años anteriores”.
En una respuesta de seguimiento, Kevin Weil, director de productos de OpenAi, dijo que Operai está considerando modelos más antiguos de emisión abierta que ya no son de última generación. “Definitivamente pensaremos en hacer más de esto”, dijo, sin entrar en más detalles.
Más allá de haber llevado a Openai a reconsiderar su filosofía de lanzamiento, Altman dijo que Deepseek ha empujado a la compañía a revelar más sobre cómo sus llamados modelos de razonamiento, como el modelo O3-Mini lanzado hoy, muestran su “proceso de pensamiento”. Actualmente, los modelos de OpenAI ocultan su razonamiento, una estrategia destinada a evitar que los competidores raspen los datos de capacitación para sus propios modelos. En contraste, el modelo de razonamiento de Deepseek, R1, muestra su cadena de pensamiento completa.
“Estamos trabajando para mostrar un montón más de lo que mostramos hoy – (mostrar el proceso de pensamiento modelo) será muy pronto”, agregó Weil. “TBD en todos: mostrar toda la cadena de pensamiento conduce a la destilación competitiva, pero también sabemos que las personas (al menos los usuarios avanzados) lo quieren, por lo que encontraremos la forma correcta de equilibrarlo”.
Altman y Weil intentaron disipar rumores de que ChatGPT, la aplicación Chatbot a través de la cual OpenAi lanza muchos de sus modelos, aumentaría en el precio. Altman dijo que le gustaría hacer que Chatgpt sea “más barato” con el tiempo, si es factible.
Altman dijo anteriormente que Operai estaba perdiendo dinero en su plan ChatGPT más caro, ChatGPT Pro, que cuesta $ 200 por mes.
En un hilo algo relacionado, Weil dijo que OpenAi continúa viendo evidencia de que más poder de cálculo conduce a modelos “mejores” y más actuantes. Eso es en gran parte lo que requiere proyectos como Stargate, Operai’s anunciado recientemente Proyecto de centro de datos masivo, dijo Weil. Servir a una base de usuarios en crecimiento está alimentando la demanda de cálculo dentro de OpenAi, continuó.
Cuando se le preguntó sobre la superación personal recursiva que podría estar habilitada por estos poderosos modelos, Altman dijo que cree que un “despegue rápido” es más plausible de lo que alguna vez creyó. La superación automática recursiva es un proceso en el que un sistema de IA podría mejorar su propia inteligencia y capacidades sin aportes humanos.
Por supuesto, vale la pena señalar que Altman es conocido por su sobreprueba. No fue hace mucho que él bajó la barra de Openai para AGI.
Un usuario de Reddit preguntó si los modelos de OpenAi, que aumentan o no, se utilizarían para desarrollar armas destructivas, específicamente armas nucleares. Esta semana, Openai anunció una asociación con el gobierno de los Estados Unidos para dar sus modelos a los Laboratorios Nacionales de los Estados Unidos en parte para la investigación de defensa nuclear.
Weil dijo que confiaba en el gobierno de los Estados Unidos.
“He llegado a conocer a estos científicos y son expertos en IA además de investigadores de clase mundial”, dijo. “Entienden el poder y los límites de los modelos, y no creo que haya ninguna posibilidad de que solo yolo sean alguna salida del modelo en un cálculo nuclear. Son inteligentes y basados en la evidencia y realizan mucha experimentación y trabajo de datos para validar todo su trabajo ”.
Al equipo de Operai se le hicieron varias preguntas sobre una naturaleza más técnica, como cuando se lanzará el próximo modelo de razonamiento de OpenAI, O3, (“más de unas pocas semanas, menos de unos pocos meses”, dijo Altman), cuando el próximo buque insignia de la compañía de la compañía ” El modelo no inicial “, GPT-5, podría aterrizar (” todavía no tengo una línea de tiempo “, dijo Altman), y cuando OpenAi podría presentar un sucesor de Dall-E 3, el modelo de generación de imágenes de la compañía. 3, que se lanzó hace unos dos años, se ha vuelto bastante viejo en el diente. La tecnología de generación de imágenes ha mejorado a pasos límites desde el debut de Dall-E 3, y el modelo es ya no es competitivo en una serie de pruebas de referencia.
“¡Sí! Estamos trabajando en ello ”, dijo Weil sobre un seguimiento de Dall-E 3. “Y creo que valdrá la pena la espera”.