Tesla, Waymo, Nuro, Zoox y muchos otros adoptan la nueva perspectiva de la IA generativa para lograr la conducción autónoma

Forbes Argentina

18 de abril de 2024, 1:45 p.m.·7 min de lectura

La IA basada en el aprendizaje automático, en particular la IA de Transformer y Large Language Model que se encuentra en ChatGPT, acaparó la mayoría de los titulares tecnológicos en los últimos años por una buena razón.

Los autos que se manejan solos, que utilizarán la IA para poner patas arriba la tercera industria más importante del mundo, también están adoptando estas nuevas tecnologías de IA tan rápido como pueden. En la reciente conferencia GTC de Nvidia, la empresa de chips con un valor de dos billones de dólares que hace el hardware de IA más popular, varias empresas esbozaron su estrategia, pero en realidad todas las empresas del espacio cambiaron su forma de manejarse firmemente hacia esta área.

Un sistema clásico de conducción autónoma se divide en módulos, que a grandes rasgos están estratificados. Los módulos principales son la percepción (lo que hay ahí fuera), la predicción (hacia dónde va todo), la planificación (hacia dónde voy a ir) y la ejecución (pedales y volante), con soporte adicional para la localización (¿dónde estoy?), así como la cartografía, la interfaz de usuario, la interfaz HQ, el manejo a distancia y mucho más. Las líneas entre percepción, predicción y planificación se convirtieron en difusas, y sobre todo en lo que se conoce como un diseño de red neuronal "de extremo a extremo".

Tesla causó sensación al reescribir su sistema de asistencia al conductor (ahora llamado conducción autónoma completa supervisada) para utilizar en gran medida redes de extremo a extremo. En un sistema E2E, hay muy poca lógica de programación tradicional.

En su lugar, entran los datos de los sensores (sobre todo de las cámaras en el caso de Tesla) y salen las decisiones de conducción. A algunos los asusta que los programadores sólo tengan una idea limitada de cómo toma decisiones el sistema, sólo saben que lo hace mejor. La mayoría de los críticos creen que el nuevo SFSD de Tesla supera al anterior, aunque muchos de ellos no se dan cuenta de lo muy por detrás que sigue estando de los demás sistemas de conducción autónoma, a pesar de las mejoras.

Tesla, Machine Learning, IA — Un Tesla equipado con el sistema FSD (ahora supervisado), que se basa más en el aprendizaje automático.

Sin embargo, hay otros creyentes en el E2E, en distintos grados, como la startup británica Wayve y la de Toronto Waabi, ambas presentadas en la GTC de Nvidia. La herramienta ADAS de código abierto "comma" también la utiliza desde hace tiempo, y se dice que HYPR, la nueva startup del cofundador de Zoox, Tim Kenley-Klay, también emplea este enfoque. Escribir el software es "fácil" porque no se escribe mucho, lo que importa es obtener los datos de entrenamiento adecuados, y muchos, combinados con mucha computación. Tesla estuvo planeando un gigantesco centro de cálculo llamado Dojo para esto, pero su construcción se retrasó, lo que al parecer hizo enojar a Elon Musk y provocó algunas de las recientes salidas de ejecutivos.

Sus datos de entrenamiento iniciales proceden de grabaciones de humanos (y robots) realizando recorridos con éxito. Tenés que eliminar o etiquetar cualquier grabación de mal comportamiento al volante o el sistema lo aprenderá (Tesla tuvo que eliminar todas las grabaciones de personas realizando frenadas con balanceo, ya que la NHTSA les ordenó que sus autos no realizaran esta actividad tan común).

La mayoría de los equipos también suman conducciones simuladas a los datos de entrenamiento, y esta es la especialidad de Waabi, que realiza la mayor parte del entrenamiento en simulador. Esto incluye el entrenamiento adversario, en el que una IA intenta ser lo más inteligente posible al crear escenarios simulados que harán que el auto se estrelle, para que pueda aprender lo que no debe hacer. Esto puede permitir que el auto haya experimentado muchas más situaciones malas que cualquier humano.

Incluso las empresas que no van a E2E están haciendo uso de la misma tecnología que se encuentra en herramientas como ChatGPT. El "gran modelo de lenguaje transformador" asombró al mundo con lo que puede hacer con los documentos escritos, pero para la IA, el texto no es más que una serie de palabras, y aprende cuál es la mejor palabra que puede sacar a continuación basándose en lo que vio hasta ahora. La tecnología del transformador ayuda a saber a qué palabras de los textos más largos vale más la pena prestar atención.

Puede que manejar no parezca escribir, pero una vez que se hizo la percepción, lo que ven los sensores puede convertirse en una cadena de tokens no muy diferente de las frases. Y así, una LLM que fue entrenada en toneladas de conducción puede llegar a ser muy buena, y muy humana, a la hora de decidir qué debe venir a continuación en cualquier situación. Podés probar esto con tu IA favorita, y podés ver que aunque todo lo que hizo fue leer libros sobre conducción, es capaz de averiguar cosas a partir de información de percepción muy básica.

La respuesta de Gemini no es perfecta, pero date cuenta de que nunca fue entrenada en ninguna conducción real, sólo leyó los manuales. Que pueda hacer lo anterior es asombroso, pero una herramienta entrenada en conducción real y sometida a pruebas de calidad puede hacerlo aún mejor. Y eso es con lo que están experimentando ahora la mayoría de las empresas de conducción autónoma. Algunas a fondo, otras con más cautela.

Nuro, por ejemplo, que fabrica vehículos de reparto, tiene tanto un planificador de IA como uno tradicional, y ambos hacen propuestas sobre lo que la máquina debe hacer en cada momento. A continuación, otra herramienta elige cuál de los planes le parece mejor. Normalmente es el planificador de IA el que hace la mejor elección y la más parecida a la humana.

Zoox tardó más en asimilar plenamente los LLM, pero también está trabajando en ello, y aunque Waymo hizo comentarios limitados, también se cree que lo está haciendo; después de todo, el modelo transformador que está en la base de todos los LLM se desarrolló en Google, el hermano de Waymo.

No siempre es bueno. Existe la sospecha de que cuando un auto Cruise hizo un giro a la izquierda desde el carril central de una calle de San Francisco, cruzándose delante de una retroexcavadora que lo golpeó, esto podría haberlo decidido un planificador de aprendizaje automático que había visto a demasiados humanos hacer acrobacias como esta. Y el problema de la "alucinación", en el que los LLM emiten respuestas plausibles pero erróneas, requiere atención.

La gente tiene miedo de los enfoques de "caja negra" que pueden tomar decisiones por razones desconocidas para sus desarrolladores. Si hay problemas, podés "solucionarlos" añadiendo más formación diseñada para desalentar las malas elecciones, pero sin la misma certeza de la programación tradicional. Con frecuencia pregunto a la gente: "¿Preferirías un auto que se estrella una vez en un millón de kilómetros pero no puede explicar por qué, aunque podés arreglarlo, o un auto que se estrella dos veces en un millón de kilómetros pero que vos sabés exactamente por qué lo hizo?". Obtengo ambas respuestas.

El desarrollador británico Wayve fusionó un LLM de texto real con su sistema de conducción E2E. Podés preguntarle en cualquier momento por qué hace lo que hace. Esperan que eso haga que la gente se sienta mejor, además de ayudar a depurarlo. Cuando estaba parado en un semáforo en rojo con algunos autos delante, le pregunté por qué no avanzaba. Mencionó el semáforo en rojo, pero no el tráfico delantero más importante, lo que me pareció un grave error, ya que no se cruzaría con ellos sólo porque el semáforo se pusiera en verde. Así pues, este enfoque necesita más trabajo, pero puede ayudar a afrontar el miedo.

Es una buena noticia que se esté trabajando con tantos enfoques diferentes, desde los LLM hasta el aprendizaje clásico por imitación y refuerzo, pasando por las limitaciones de la robótica tradicional, que es mejor para seguir rígidamente las normas de circulación.

Tesla y MobilEye cuentan con las mayores reservas de datos de conductores humanos y esperan que eso les dé ventaja en un mundo en el que gana el que más datos de entrenamiento y computación tiene. Pero hay muchos datos ahí fuera, y mucho cálculo, si tenemos en cuenta que empresas como Google, Amazon y Nvidia siguen luchando en este juego. Aunque varias empresas se retiraron de esta carrera, incluidos los proyectos de los principales fabricantes de autos, todavía hay muchas en la víspera, con la esperanza de ser las primeras en desplegar el sueño de la conducción autónoma a escala.

*Con información de Forbes US

AFP
El espectáculo del Sena da paso a la competición en París-2024
Tras la majestuosa ceremonia de apertura celebrada en el Sena el viernes, los Juegos de París-2024 meten la directa este sábado con el inicio de la competición en más de una veintena de disciplinas y el reparto de las primeras medallas.Otros deportes que repartirán ya medallas son la esgrima, el judo, los clavados, el skateboarding o el tiro deportivo, donde probablemente se decida el primer campeón olímpico de París-2024.
Euronews
'Del revés 2' se convierte en la película de animación más taquillera de todos los tiempos
'Del revés 2' se ha convertido oficialmente en la película de animación más taquillera de todos los tiempos. Ha superado a 'Frozen II', que ostentaba el récord desde 2019.
LA NACION
Ver París 2024 online: cómo ver los Juegos Olímpicos en vivo
El evento multidisciplinario más importante del mundo quedó inaugurado este viernes 26 de julio, tras la Ceremonia de Apertura; se extiende hasta el domingo 11 de agosto
EFE Latam
Los Premios Eisner de cómic reconocen a cuatro artistas españoles en su 36 edición
San Diego (EE.UU.), 26 jul (EFE).- Los Premios Eisner, considerados los Óscar del cómic, galardonaron este viernes a cuatro artistas españoles durante su edición número 36 que se llevó a cabo en el marco de la Comic-Con de San Diego (California).
Euronews
Donald Trump tacha de "falta de respeto" las declaraciones de Kamala Harris sobre la guerra entre Israel y Hamás
La vicepresidenta Kamala Harris afirmó el jueves que Israel tiene derecho a la autodefensa, pero matizó que "importa cómo lo haga".
AFP
La apertura de los Juegos de París: una apuesta exitosa de Macron
Prometieron un espectáculo "único", un desafío "imposible" hecho realidad, un Sena convertido en escenario de la historia de Francia: el éxito de la ceremonia de inauguración de París-2024 a pesar de la lluvia es también la apuesta triunfante de Emmanuel Macron., celebró Macron en su cuenta de X, donde elogió una "ceremonia grandiosa" y un "momento único y mágico".
LA NACION
Venezuela bloquea un vuelo con expresidentes y denuncian más deportaciones de dirigentes internacionales
Un avión no pudo salir de Ciudad de Panamá por una restricción del espacio aéreo venezolano; impiden ingresar a la delegación del PP español
LA NACION
El increíble regalo francés al mundo: la fiesta de apertura más original y dinámica de la historia de los Juegos Olímpicos
París 2024 quedó formalmente inaugurado después de que un globo aerostático levantara vuelo, simbolizando el pebetero; las delegaciones surcaron el Sena en barcos
hola.com
El espectacular cambio físico de Juan del Val a los 53 años tras dos meses de dieta y ejercicio, ¡con piropazo de Nuria Roca!
El colaborador de 'El Hormiguero' ha compartido una foto en su perfil luciendo tipazo y le han llovido los halagos
LA NACION
El Museo Nacional de Cera de Dublín quiso homenajear a Sinéad O’Connor pero todo terminó de la peor manera
El jueves, la institución dio a conocer con orgullo la réplica de la cantante irlandesa fallecida en 2023, pero ante una oleada imparable de comentarios que cuestionaban el parecido, se vieron oblidados a tomar una drástica decisión
AFP
La sonda Juice se prepara para rebotar entre la Tierra y la Luna rumbo a Júpiter
La sonda espacial Juice se prepara para una maniobra arriesgada y sin precedentes el mes que viene, al utilizar la fuerza gravitacional de la Tierra y la Luna para efectuar un gran salto hacia su meta, el planeta Júpiter.Muchas otras misiones espaciales han utilizado planetas para obtener impulsos gravitacionales, pero esa trayectoria entre la Tierra y la Luna del próximo mes será una "primicia mundial," dijo la ESA. Será la primera vez que una misión utilice un impulso gravitacional doble.
Newsweek
Más de 10 toneladas de basura se acomulan en la Feria Villista
Emiliano González Martines director de Servicios públicos municipal, dio a conocer que ha...
LA NACION
Luto en el fútbol argentino: murió un jugador de 17 años de Mitre de Santiago del Estero
Integraba el plantel de la primera división y la reserva en la liga provincial; el club confirmó la noticia a través de un comunicado en sus redes sociales
San Diego Red
La Casa de los Famosos sorprende con fiesta temática inspirada en Deadpool y Wolverine
Este viernes por la noche, La Casa de los Famosos volvió a sorprender a sus seguidores con una de sus dinámicas más populares.
AP
Edmundo González, inesperado candidato opositor que pretende sacar a Maduro del poder en Venezuela
CARACAS (AP) — Apenas tres meses antes de la fecha prevista para las elecciones de Venezuela, Edmundo González Urrutia recibió una encomienda que jamás buscó: ser el candidato de la principal coalición opositora que pretender sacar a Nicolás Maduro del poder, tras 25 años de gobiernos socialistas.Desde entonces, ha caminado de la mano en actos de campaña en territorio con María Corina Machado, la líder opositora que abanderaba los anhelos de cambios de sus seguidores desde que ganó las primarias
AP
Maduro en tres tiempos: la elección de Venezuela pone a prueba su receta económica y figura de líder
CARACAS (AP) — De ser un personaje secundario con Hugo Chávez al mando de Venezuela, Nicolás Maduro pasó a gobernar el país, en sus propias palabras, con mano de hierro. Su mandato en la última década, que ha contemplado una etapa de flexibilización de la receta económica socialista, se somete el domingo a un examen clave de revalidación en las urnas en unas elecciones en las que enfrenta su principal desafío electoral desde que asumió el poder en el 2013.
hola.com
Planes en la Selva de Irati, declarada nueva Reserva de la Biosfera
La UNESCO ha designado once nuevas reservas en el mundo y este bosque interminable que se reparte entre los valles de Aezkoa y Salazar en su vertiente española, el segundo hayedo más grande de Europa, es una de ellas.
Associated Press
Las perspectivas tras el arresto de "El Mayo": Más violencia en México y más información en EEUU
CIUDAD DE MÉXICO (AP) — Con la detención de Ismael “El Mayo” Zambada, el último de los viejos grandes narcotraficantes mexicanos, comienza una nueva etapa para el Cártel de Sinaloa — uno de los más poderosos del mundo— que los expertos creen puede conllevar a más violencia en México y un considerable flujo de información procedente de los procesos judiciales en cortes estadounidenses.Zambada, quien eludió a las autoridades durante décadas y nunca pisó una cárcel, era uno de los capos más viejos
LA NACION
Polo: Argentina visita a Inglaterra en Windsor con un 10 goles y expone su invicto de 71 años por la Copa Coronación
En el club real Guards, el seleccionado de AAP presentará un equipo de 26 goles de handicap y comenzará ganando por 1-0
LA Times en Español
LAFC inicia con pie derecho la Leagues Cup al golear a los Xolos de Tijuana en el BMO Stadium
El LAFC derrotó a los Xolos de Tijuana el viernes en Los Ángeles en una noche larga para los del nuevo entrenador Juan Carlos Osorio, que fue expulsado del encuentro.

S&P 500

Dow Jones

Nasdaq

Russell 2000

Petróleo

Oro

Plata

dólar/euro

Bono a 10 años

dólar/libra

yen/dólar

Bitcoin USD

CMC Crypto 200

FTSE 100

Nikkei 225

Tesla, Waymo, Nuro, Zoox y muchos otros adoptan la nueva perspectiva de la IA generativa para lograr la conducción autónoma

Historias más recientes

El espectáculo del Sena da paso a la competición en París-2024

'Del revés 2' se convierte en la película de animación más taquillera de todos los tiempos

Ver París 2024 online: cómo ver los Juegos Olímpicos en vivo

Los Premios Eisner de cómic reconocen a cuatro artistas españoles en su 36 edición

Donald Trump tacha de "falta de respeto" las declaraciones de Kamala Harris sobre la guerra entre Israel y Hamás

La apertura de los Juegos de París: una apuesta exitosa de Macron

Venezuela bloquea un vuelo con expresidentes y denuncian más deportaciones de dirigentes internacionales

El increíble regalo francés al mundo: la fiesta de apertura más original y dinámica de la historia de los Juegos Olímpicos

El espectacular cambio físico de Juan del Val a los 53 años tras dos meses de dieta y ejercicio, ¡con piropazo de Nuria Roca!

El Museo Nacional de Cera de Dublín quiso homenajear a Sinéad O’Connor pero todo terminó de la peor manera

La sonda Juice se prepara para rebotar entre la Tierra y la Luna rumbo a Júpiter

Más de 10 toneladas de basura se acomulan en la Feria Villista

Luto en el fútbol argentino: murió un jugador de 17 años de Mitre de Santiago del Estero

La Casa de los Famosos sorprende con fiesta temática inspirada en Deadpool y Wolverine

Edmundo González, inesperado candidato opositor que pretende sacar a Maduro del poder en Venezuela

Maduro en tres tiempos: la elección de Venezuela pone a prueba su receta económica y figura de líder

Planes en la Selva de Irati, declarada nueva Reserva de la Biosfera

Las perspectivas tras el arresto de "El Mayo": Más violencia en México y más información en EEUU

Polo: Argentina visita a Inglaterra en Windsor con un 10 goles y expone su invicto de 71 años por la Copa Coronación

LAFC inicia con pie derecho la Leagues Cup al golear a los Xolos de Tijuana en el BMO Stadium