Herramienta gratuita de análisis de imágenes de Google AI

Google ofrece una herramienta de clasificación de imágenes de IA que analiza las imágenes para clasificar el contenido y asignarles etiquetas.

La herramienta está destinada a la demostración de Visión de Googleque puede escalar la clasificación de imágenes de forma automática, pero se puede usar como una herramienta independiente para ver cómo el algoritmo de detección de imágenes ve sus imágenes y para qué son adecuadas.

Incluso si no usa la API de Google Vision para escalar la detección y clasificación de imágenes, la herramienta proporciona una vista interesante de lo que son capaces de hacer los algoritmos relacionados con imágenes de Google, lo que hace que sea interesante cargar imágenes para ver cómo las clasifica el algoritmo de Google Vision. .

Esta herramienta demuestra la IA de Google y los algoritmos de aprendizaje automático para la comprensión de imágenes.

esto es parte de google Paquete de la API de Cloud Vision que ofrece modelos visuales de aprendizaje automático para aplicaciones y sitios web.

¿Cloud Vision Tool refleja el algoritmo de Google?

Este es solo un modelo de aprendizaje automático, no un algoritmo de clasificación.

Por lo tanto, no es realista usar esta herramienta y esperar que refleje algo sobre el algoritmo de clasificación de imágenes de Google.

Sin embargo, es una gran herramienta para comprender cómo la inteligencia artificial y los algoritmos de aprendizaje automático de Google pueden comprender las imágenes, y ofrecerá una perspectiva educativa sobre cuán avanzados son los algoritmos relacionados con la visión de la actualidad.

La información proporcionada por esta herramienta se puede utilizar para comprender cómo una máquina puede comprender qué es una imagen y, posiblemente, proporcionar una idea de qué tan bien se ajusta esa imagen al tema general de una página web.

¿Por qué es útil la herramienta de clasificación de imágenes?

Las imágenes pueden desempeñar un papel importante en la visibilidad de búsqueda y el CTR de las diferentes formas en que se muestra el contenido de la página web en Google.

Los visitantes potenciales del sitio que investigan un tema usan imágenes para navegar al contenido correcto.

Por lo tanto, usar imágenes atractivas que sean relevantes para las consultas de búsqueda puede, en ciertos contextos, ser útil para comunicar rápidamente que una página web es relevante para lo que busca una persona.

La herramienta Google Vision proporciona una manera de comprender cómo un algoritmo puede ver y clasificar una imagen en términos de lo que hay en la imagen.

en Google pautas para el SEO de imágenes recomendamos:

“Las fotos de alta calidad atraen más a los usuarios que las imágenes borrosas y borrosas. Además, las imágenes claras son más atractivas para los usuarios en la miniatura de resultados y aumentan la probabilidad de recibir tráfico de los usuarios".

Si la herramienta Vision tiene problemas para identificar la imagen, esto puede ser una señal de que los visitantes potenciales del sitio también pueden tener los mismos problemas y decidir no visitar el sitio.

¿Qué es la herramienta de imágenes de Google?

La herramienta es una forma de demostrar la API de Google Cloud Vision.

La API de Cloud Vision es un servicio que permite que las aplicaciones y los sitios web se conecten a la herramienta de aprendizaje automático, proporcionando servicios de análisis de imágenes escalables.

La herramienta independiente en sí le permite cargar una imagen y le dice cómo la interpreta el algoritmo de aprendizaje automático de Google.

La página de Google Cloud Vision describe cómo se puede utilizar el servicio de la siguiente manera:

"Cloud Vision permite a los desarrolladores integrar fácilmente las funciones de detección de visión en las aplicaciones, incluido el etiquetado de imágenes, el reconocimiento de rostros y puntos de referencia, el reconocimiento óptico de caracteres (OCR) y el etiquetado de contenido explícito".

Estas son cinco formas en que las herramientas de análisis de imágenes de Google clasifican las imágenes cargadas:

  1. personas
  2. Objetos.
  3. Etiquetas.
  4. Propiedades.
  5. Búsqueda segura.

personas

La sección de rostros proporciona un análisis de la emoción expresada por la imagen.

La precisión de este resultado es bastante precisa.

La imagen de abajo es una persona descrita como confundida, pero eso no es realmente una emoción.

AI describe la emoción facial como sorpresa con un 96 % de confianza.

Imagen compuesta creada por el autor, julio de 2022; imágenes obtenidas de Google Cloud Vision API y Shutterstock / Cast Of Thousands

Objetos

La sección de objetos muestra qué objetos hay en la imagen, como gafas, una persona, etc.

La herramienta identifica con precisión caballos y humanos.

Captura de pantalla de la herramienta Google VisionImagen compuesta creada por el autor, julio de 2022; imágenes obtenidas de Google Cloud Vision API y Shutterstock / Lukas Gojda

Etiquetas

La pestaña Etiquetas muestra detalles por la imagen que reconoce Google, como las orejas y la boca, pero también por aspectos conceptuales como el retrato y la fotografía.

Esto es particularmente interesante porque muestra cuán profundamente la IA de imágenes de Google puede comprender lo que hay en una imagen.

Captura de pantalla de Google Vision AI identificando objetos dentro de una foto cargadaImagen compuesta creada por el autor, julio de 2022; imágenes obtenidas de Google Cloud Vision API y Shutterstock / Lukas Gojda

¿Google usa esto como parte del algoritmo de clasificación? Esto es algo que no se sabe.

Propiedades

Las propiedades son los colores utilizados en la imagen.

Captura de pantalla de la herramienta Google Vision que identifica los colores dominantes en una imagenCaptura de pantalla de la API de Google Cloud Vision, julio de 2022

A primera vista, el punto de esta herramienta no es obvio y puede parecer que es algo inútil.

Pero en realidad, los colores de una imagen pueden ser muy importantes, especialmente para una imagen destacada.

Las imágenes que contienen una gama muy amplia de colores pueden ser un indicio de una imagen hinchada mal seleccionada, algo que hay que tener en cuenta.

Otra información útil sobre las imágenes y el color es que las imágenes con una gama de colores más oscura generalmente generan archivos de imagen más grandes.

En términos de SEO, la pestaña Propiedad puede ser útil para identificar imágenes en todo un sitio web que se pueden reemplazar por otras menos infladas.

Además, los rangos de color para las imágenes destacadas que están silenciadas o incluso en escala de grises pueden ser algo a tener en cuenta, ya que las imágenes destacadas que carecen de colores vibrantes tienden a no aparecer en las redes sociales, Google Discover y Google News.

Por ejemplo, las imágenes destacadas que son brillantes se pueden escanear fácilmente y potencialmente obtener una tasa de clics (CTR) más alta cuando se muestran en los resultados de búsqueda o en Google Discover porque atraen la atención mejor que las imágenes que están silenciadas y se desvanecen en el fondo. .

Hay muchas variables que pueden afectar el rendimiento del CTR de la imagen, pero esto proporciona una forma de aumentar el proceso de auditoría de imágenes en todo el sitio web.

eBay fue dirigido por un investigación de imagen de producto y CTR y descubrió que las imágenes con colores de fondo más claros tienden a tener un CTR más alto.

Los investigadores de eBay señalaron:

"En este artículo, encontramos que las características de la imagen del producto pueden influir en el comportamiento de búsqueda del consumidor.

Descubrimos que ciertas características de la imagen se correlacionan con el CTR en un motor de búsqueda de productos y que estas características pueden ayudar a modelar las tasas de clics para las aplicaciones de búsqueda de compras.

Este estudio puede dar a los vendedores un incentivo para ofrecer mejores imágenes de los productos que venden.

Como anécdota, el uso de colores brillantes para las imágenes destacadas puede ser útil para aumentar el CTR de los sitios que dependen del tráfico de Google Discover y Google News.

Obviamente, hay muchos factores que afectan el CTR de Google Discover y Google News. Pero una imagen que destaque del resto puede ser útil.

Por esta razón, usar la herramienta Vision para comprender los colores utilizados puede ser útil para la auditoría de imágenes a gran escala.

Búsqueda segura

Safe Search muestra cómo se clasifica la imagen para contenido peligroso. Las descripciones de las imágenes potencialmente peligrosas son las siguientes:

  • Adulto.
  • Una fabricación.
  • Médico.
  • Violencia.
  • Picante.

La Búsqueda de Google tiene filtros que clasifican una página web por contenido peligroso o inapropiado.

Por esta razón, la sección de búsqueda segura de la herramienta es muy importante, porque si una imagen activa inadvertidamente un filtro de búsqueda segura, es posible que la página web no se clasifique para los visitantes potenciales del sitio que buscan el contenido de la página web.

Análisis de Google Vision de búsqueda seguraCaptura de pantalla de la API de Google Cloud Vision, julio de 2022

La captura de pantalla anterior muestra la calificación de una foto de caballos de carreras en una pista de carreras. La herramienta identifica con precisión que no hay contenido médico o para adultos en una imagen.

Texto: reconocimiento óptico de caracteres (OCR)

Google Vision tiene una capacidad notable para leer el texto que se encuentra en una foto.

La herramienta Vision es capaz de leer con precisión el texto de la siguiente imagen:

Captura de pantalla de la herramienta Vision que lee con precisión el texto de una imagenImagen compuesta creada por el autor, julio de 2022; imágenes obtenidas de Google Cloud Vision API y Shutterstock / Melissa King

Como se puede ver arriba, Google realmente tiene la capacidad (a través de Reconocimiento óptico de caracteres, también conocido como OCR) para leer palabras en imágenes.

Sin embargo, esto no es una indicación de que Google use OCR para fines de clasificación de búsqueda.

El hecho es que Google recomienda usar palabras alrededor de las imágenes para ayudarlo a descubrir qué es la imagen, y puede ser que incluso para las imágenes con texto, Google aún dependa de las palabras alrededor de la imagen para descubrir qué es la imagen. está relacionado y es adecuado para.

en Google directrices de seo de imagen enfatizar repetidamente el uso de palabras para proporcionar contexto a las imágenes.

“Al agregar más contexto alrededor de las imágenes, los resultados pueden volverse mucho más útiles, lo que puede conducir a un tráfico de mayor calidad a su sitio.

… Siempre que sea posible, coloque imágenes cerca del texto relevante.

... Google extrae información sobre el tema de la imagen del contenido de la página ...

... Google utiliza texto alternativo junto con algoritmos de visión por computadora y contenido de la página para comprender el tema de la imagen.

Está muy claro en la documentación de Google que Google depende del contexto del texto que rodea las imágenes para comprender de qué se trata la imagen.

Sacar

La herramienta Google Vision AI proporciona una forma de probar Vision AI de Google para que un editor pueda conectarse a ella a través de una API y usarla para escalar la clasificación de imágenes y la extracción de datos para su uso dentro del sitio.

Pero también da una idea de hasta dónde han llegado los algoritmos para el etiquetado de imágenes, la anotación y el reconocimiento óptico de caracteres.

Sube una imagen aquí para ver cómo se clasifica y si una máquina lo ve de la misma manera que tú.

Más recursos:


Imagen destacada de Maxim Shmelov / Shutterstock

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir