"Soy CEO de una empresa de robótica y creo que la IA nos ha fallado": qué nos dicen Spotify o GMail sobre sus límites actuales

“Al margen de dibujar imágenes fotorrealistas y mantener conversaciones aparentemente sensibles, la inteligencia artificial nos ha fallado“, así comienza un artículo recientemente publicado de Ali Kashani, cofundador y CEO de Serve Robotics. Kashani nos aconseja no tener expectativas sobre la IA propias de la ciencia ficción… y así no exponernos a que termine cundiendo el escepticismo en torno a esta tecnología.

Para saber qué es “propio de la ciencia ficción”, conviene tener claro que la IA, hoy en día, puede lograr un rendimiento muy alto si se centra en la precisión o en la exhaustividad, optimizando uno a expensas del otro (es decir, menos falsos positivos a cambio de más falsos negativos, y viceversa); es lo que llamamos una inteligencia artificial lo-fi. Pero, ¿lograr un alto rendimiento en ambos simultáneamente?, ahí es donde aparecen las dificultades:

“Resolver esto sigue siendo el santo grial de la IA. Hoy en día, no existen aplicaciones comerciales que se basen en IA de alta fidelidad. De hecho, puede que aún se encuentren a décadas de distancia“.

El Valor-F como medida de madurez de la IA…

Una forma habitual de evaluar la fiabilidad de una IA es su Valor-F, un promedio numérico de precisión y exhaustividad: un Valor-F del 100% (una IA hi-fi) representa una IA perfectamente libre de errores, capaz de manejar todos los casos extremos. Y, en realidad, muchas de las aplicaciones actuales de la inteligencia artificial no requieren ni acercarse a tal valor.

Si usas la librería de machine learning para Python ‘scikit-learn’, te resultará útil saber que ‘exhaustividad’ es la métrica ‘sklearn.metrics.recall_score’, y que ‘Valor-F’ es ‘sklearn.metrics.f1_score’

En Xataka

Los seis mejores cursos online para formarte en inteligencia artificial

Kashani aborda, por ejemplo, el caso de los algoritmos de recomendación:

“Si Spotify reproduce canciones que te gustan el 95% del tiempo (precisión), pero solo aparece la mitad de las canciones que te gustan (recuerdo del 50%), su F1 sería del 65%. Esta es una puntuación aceptable, porque una alta precisión hace que la experiencia del usuario sea excelente, mientras que los usuarios no perciben la baja exhasutividad”.

Sin embargo, cuando llegamos a los vehículos autónomos, el umbral de lo ‘aceptable’ varía (por mucho):

“Cuando un taxi autónomo decide si cruzar en un semáforo, está tomando una decisión de seguridad sensible al tiempo. Tanto ignorar un semáforo en rojo (falso negativo) como frenar inesperadamente en verde (falso positivo) son acciones con un alto riesgo de colisión. [Se ha estimado] que un vehículo autónomo debe lograr más del 99.9999% de precisión y un 99.9999% de exhaustividad en la detección de luces rojas para estar a la par con los humanos”.

…comparado con el ‘uptime’ como medida de madurez de la nube

De igual modo que el Valor-F es una medida del nivel de madurez de la IA, el ‘uptime’ (tiempo de actividad operativo) es una medida de la madurez de los servicios web y cloud. Así, con sus 30 años de antigüedad, la web es una de las experiencias digitales más fiables, nos recuerda Kashani: los sitios web como Google y Gmail tienden a tener un tiempo de actividad del 99.999%.

Cinco nueves —ojo—, no seis. Lo cual significa que el servicio no permanece caído más de seis minutos por año: aunque algunos años han experimentado excepciones graves, como la interrupción de seis horas de Gmail en 2020“.

En Xataka

El papel de la intuición en el desarrollo de la conducción autónoma (y cómo podemos simularla)

“Con aproximadamente la mitad de la edad de la WWW, la nube es menos confiable. La mayoría de los servicios ofrecidos por Amazon AWS tienen un SLA de tiempo de actividad menor, del 99,99 %. Tenga en cuenta que la conducción autónoma también se ejecuta en ordenadores similares a los que ejecutan los servicios cloud. Sin embargo, el ‘uptime’ requerido por los taxis autónomos debe exceder el rendimiento de aquellos”.

Kashani, que al fin y al cabo dirige una empresa, finaliza su artículo llevando el debate a su terreno (comercial) para reivindicar que el tipo de tecnología que ofrece su empresa es una oportunidad de negocio factible a corto plazo y no es ‘ciencia ficción’, como sería la IA ‘hi-fi’. Un final decepcionantemente comercial para un artículo que, sin embargo, ofrece varios datos interesantes para evaluar dónde se encuentra la IA hoy en día.

–
La noticia “Soy CEO de una empresa de robótica y creo que la IA nos ha fallado”: qué nos dicen Spotify o GMail sobre sus límites actuales fue publicada originalmente en Genbeta por Marcos Merino .

"Soy CEO de una empresa de robótica y creo que la IA nos ha fallado": qué nos dicen Spotify o GMail sobre sus límites actuales

El Valor-F como medida de madurez de la IA…

…comparado con el ‘uptime’ como medida de madurez de la nube

admin

Read Next

Aprende a crear agentes de inteligencia artificial: los 10 mejores cursos gratuitos de 2024

Los mejores motores de búsqueda con inteligencia artificial en 2024

Puedes ahorrarte un buen dinero en la piscina este verano: esta web te dice qué dice cómo tramitar ayudas desde tu iPhone

Alguien se aburría y ha echado dos meses intentando que Windows XP funcione en este mítico procesador 24 años después. Lo logró

TikTok se atreve con vídeos de una hora: ¿Busca destronar a YouTube?

Aprende a crear agentes de inteligencia artificial: los 10 mejores cursos gratuitos de 2024

Los mejores motores de búsqueda con inteligencia artificial en 2024

Puedes ahorrarte un buen dinero en la piscina este verano: esta web te dice qué dice cómo tramitar ayudas desde tu iPhone

Alguien se aburría y ha echado dos meses intentando que Windows XP funcione en este mítico procesador 24 años después. Lo logró

TikTok se atreve con vídeos de una hora: ¿Busca destronar a YouTube?

Leave a Reply Cancel reply

Asqueroso pero cierto: tu iPhone está más sucio que tu retrete. Estas son las recomendaciones para mantenerlo limpio y desinfectado

Apple CarPlay presenta sus novedades: más de 200 coches suman compatibilidad con este sistema operativo

Aprende a crear agentes de inteligencia artificial: los 10 mejores cursos gratuitos de 2024

Los mejores motores de búsqueda con inteligencia artificial en 2024

Este teléfono iPhone 15 Pro de gran capacidad se desploma a precio mínimo para despreocuparse del almacenamiento

Nueve widgets para Android que siguen mereciendo la pena en 2024

Puedes ahorrarte un buen dinero en la piscina este verano: esta web te dice qué dice cómo tramitar ayudas desde tu iPhone

El Valor-F como medida de madurez de la IA…

…comparado con el ‘uptime’ como medida de madurez de la nube

Read Next

Aprende a crear agentes de inteligencia artificial: los 10 mejores cursos gratuitos de 2024

Los mejores motores de búsqueda con inteligencia artificial en 2024

Puedes ahorrarte un buen dinero en la piscina este verano: esta web te dice qué dice cómo tramitar ayudas desde tu iPhone

Alguien se aburría y ha echado dos meses intentando que Windows XP funcione en este mítico procesador 24 años después. Lo logró

TikTok se atreve con vídeos de una hora: ¿Busca destronar a YouTube?

Primera fotografía oficial del JWT

Nokia T10, la nueva tablet todoterreno con un diseño resistente y preparada para el uso diario

Related Articles

Leave a Reply Cancel reply