"Soy CEO de una empresa de robótica y creo que la IA nos ha fallado": qué nos dicen Spotify o GMail sobre sus límites actuales

"Al margen de dibujar imágenes fotorrealistas y mantener conversaciones aparentemente sensibles, la inteligencia artificial nos ha fallado", así comienza un artículo recientemente publicado de Ali Kashani, cofundador y CEO de Serve Robotics. Kashani nos aconseja no tener expectativas sobre la IA propias de la ciencia ficción… y así no exponernos a que termine cundiendo el escepticismo en torno a esta tecnología.

Para saber qué es "propio de la ciencia ficción", conviene tener claro que la IA, hoy en día, puede lograr un rendimiento muy alto si se centra en la precisión o en la exhaustividad, optimizando uno a expensas del otro (es decir, menos falsos positivos a cambio de más falsos negativos, y viceversa); es lo que llamamos una inteligencia artificial lo-fi. Pero, ¿lograr un alto rendimiento en ambos simultáneamente?, ahí es donde aparecen las dificultades:

"Resolver esto sigue siendo el santo grial de la IA. Hoy en día, no existen aplicaciones comerciales que se basen en IA de alta fidelidad. De hecho, puede que aún se encuentren a décadas de distancia".

Un vistazo a…

ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

El Valor-F como medida de madurez de la IA…

Una forma habitual de evaluar la fiabilidad de una IA es su Valor-F, un promedio numérico de precisión y exhaustividad: un Valor-F del 100% (una IA hi-fi) representa una IA perfectamente libre de errores, capaz de manejar todos los casos extremos. Y, en realidad, muchas de las aplicaciones actuales de la inteligencia artificial no requieren ni acercarse a tal valor.

Si usas la librería de machine learning para Python 'scikit-learn', te resultará útil saber que 'exhaustividad' es la métrica 'sklearn.metrics.recall_score', y que 'Valor-F' es 'sklearn.metrics.f1_score'

En Xataka

Los seis mejores cursos online para formarte en inteligencia artificial

Kashani aborda, por ejemplo, el caso de los algoritmos de recomendación:

"Si Spotify reproduce canciones que te gustan el 95% del tiempo (precisión), pero solo aparece la mitad de las canciones que te gustan (recuerdo del 50%), su F1 sería del 65%. Esta es una puntuación aceptable, porque una alta precisión hace que la experiencia del usuario sea excelente, mientras que los usuarios no perciben la baja exhasutividad".

Sin embargo, cuando llegamos a los vehículos autónomos, el umbral de lo 'aceptable' varía (por mucho):

"Cuando un taxi autónomo decide si cruzar en un semáforo, está tomando una decisión de seguridad sensible al tiempo. Tanto ignorar un semáforo en rojo (falso negativo) como frenar inesperadamente en verde (falso positivo) son acciones con un alto riesgo de colisión. [Se ha estimado] que un vehículo autónomo debe lograr más del 99.9999% de precisión y un 99.9999% de exhaustividad en la detección de luces rojas para estar a la par con los humanos".

…comparado con el 'uptime' como medida de madurez de la nube

De igual modo que el Valor-F es una medida del nivel de madurez de la IA, el 'uptime' (tiempo de actividad operativo) es una medida de la madurez de los servicios web y cloud. Así, con sus 30 años de antigüedad, la web es una de las experiencias digitales más fiables, nos recuerda Kashani: los sitios web como Google y Gmail tienden a tener un tiempo de actividad del 99.999%.

Cinco nueves —ojo—, no seis. Lo cual significa que el servicio no permanece caído más de seis minutos por año: aunque algunos años han experimentado excepciones graves, como la interrupción de seis horas de Gmail en 2020".

En Xataka

El papel de la intuición en el desarrollo de la conducción autónoma (y cómo podemos simularla)

"Con aproximadamente la mitad de la edad de la WWW, la nube es menos confiable. La mayoría de los servicios ofrecidos por Amazon AWS tienen un SLA de tiempo de actividad menor, del 99,99 %. Tenga en cuenta que la conducción autónoma también se ejecuta en ordenadores similares a los que ejecutan los servicios cloud. Sin embargo, el 'uptime' requerido por los taxis autónomos debe exceder el rendimiento de aquellos".

Kashani, que al fin y al cabo dirige una empresa, finaliza su artículo llevando el debate a su terreno (comercial) para reivindicar que el tipo de tecnología que ofrece su empresa es una oportunidad de negocio factible a corto plazo y no es 'ciencia ficción', como sería la IA 'hi-fi'. Un final decepcionantemente comercial para un artículo que, sin embargo, ofrece varios datos interesantes para evaluar dónde se encuentra la IA hoy en día.

El Valor-F como medida de madurez de la IA…

…comparado con el 'uptime' como medida de madurez de la nube

RECIBE "Xatakaletter", NUESTRA NEWSLETTER SEMANAL

Explora en nuestros medios