Noticias

Entrenamiento de modelos de IA en YouTube: ¿Violación de privacidad?

Published

2 años ago

julio 16, 2024

Un comentarista tecnológico sostiene un iPhone mientras habla a la cámara — El YouTuber Marques Brownlee discute iOS 18 en un nuevo video. Este video específico no formaba parte del gran conjunto de datos que se utilizó para entrenar modelos de IA, pero muchos de sus otros videos sí.

Los modelos de IA en Apple, Salesforce, Anthropic y otros grandes jugadores tecnológicos fueron entrenados en decenas de miles de videos de YouTube sin el consentimiento de los creadores y potencialmente en violación de los términos de YouTube, según un nuevo informe publicado tanto en Proof News como en Wired.

El polémico uso de datos de YouTube para entrenar IA

Las empresas entrenaron sus modelos en parte utilizando “The Pile”, una colección de la organización sin fines de lucro EleutherAI que se creó como una forma de ofrecer un conjunto de datos útil a individuos o empresas que no tienen los recursos para competir con las grandes tecnológicas, aunque también ha sido utilizado por esas empresas más grandes.

El Pile incluye libros, artículos de Wikipedia y mucho más. Eso incluye leyendas de YouTube recopiladas por la API de leyendas de YouTube, extraídas de 173,536 videos de YouTube en más de 48,000 canales. Esto incluye videos de grandes YouTubers como MrBeast, PewDiePie y el popular comentarista tecnológico Marques Brownlee. En X, Brownlee criticó el uso de los datos por parte de Apple, pero reconoció que asignar la culpa es complejo cuando Apple no recopiló los datos en sí mismo. Él escribió:

Apple ha obtenido datos para su IA de varias empresas

Una de ellas extrajo un montón de datos/transcripciones de videos de YouTube, incluido el mío

Apple técnicamente evita la “culpa” aquí porque no son quienes extraen los datos

Pero este será un problema en evolución durante mucho tiempo

Reacciones de los creadores de contenido

La mayoría de los creadores se sorprendieron al saber que su contenido había sido utilizado de esta manera, y aquellos que proporcionaron declaraciones criticaron a EleutherAI y a las empresas que usaron su conjunto de datos.

Nadie vino a mí y dijo: “Nos gustaría usar esto”… Esto es mi sustento, y dedico tiempo, recursos, dinero y personal a crear este contenido. Realmente no hay escasez de trabajo.

Estamos frustrados al saber que nuestro contenido educativo cuidadosamente producido ha sido utilizado de esta manera sin nuestro consentimiento.

Además, surge la pregunta de si la extracción de este contenido viola los términos de YouTube, que prohíben el acceso a los videos por “medios automatizados”. El fundador de EleutherAI, Sid Black, afirmó que usó un script para descargar las leyendas a través de la API de YouTube, al igual que lo hace un navegador web.

Anthropic es una de las empresas que ha entrenado modelos en el conjunto de datos, y afirma que no hay ninguna violación aquí. La portavoz Jennifer Martinez dijo:

El Pile incluye un pequeño subconjunto de subtítulos de YouTube… Los términos de YouTube cubren el uso directo de su plataforma, que es distinto del uso del conjunto de datos de The Pile. Sobre el punto de posibles violaciones de los términos de servicio de YouTube, tendríamos que remitirte a los autores de The Pile.

Un portavoz de Google le dijo a Proof News que Google ha tomado “medidas a lo largo de los años para evitar la extracción abusiva y no autorizada”, pero no proporcionó una respuesta más específica. Esta no es la primera vez que las empresas de IA y tecnología han sido objeto de críticas por entrenar modelos en videos de YouTube sin permiso. Notablemente, se cree que OpenAI (la empresa detrás de ChatGPT y la herramienta de generación de videos Sora) ha utilizado datos de YouTube para entrenar sus modelos, aunque no todas las acusaciones al respecto han sido confirmadas.

En una entrevista con Nilay Patel de The Verge, el CEO de Google, Sundar Pichai, sugirió que el uso de videos de YouTube para entrenar a OpenAI’s Sora habría violado los términos de YouTube. Sin embargo, ese uso es distinto de la extracción de leyendas a través de la API.

Con el continuo aumento del contenido generado por IA en Internet, será cada vez más desafiante reunir conjuntos de datos para entrenar IA que no incluyan contenido producido previamente por IA. La falta de control de los propietarios de propiedad intelectual sobre cómo se utiliza su trabajo en la web abierta se hace evidente.

Es importante destacar que no necesariamente se utilizó esta información para entrenar modelos que produzcan contenido competitivo que llegue a los usuarios finales. Por ejemplo, Apple puede haber entrenado en el conjunto de datos con fines de investigación o para mejorar la predicción de texto en sus dispositivos.

Como se mencionó anteriormente, el uso de The Pile no es algo nuevo en círculos de IA y se ha sabido que se utiliza para el entrenamiento de empresas tecnológicas en el pasado. Ha sido citado en múltiples demandas por propietarios de propiedad intelectual contra empresas de IA y tecnología. Los demandados en esas demandas, incluido OpenAI, argumentan que este tipo de extracción es un uso justo. Las demandas aún no se han resuelto en los tribunales.

Sin embargo, Proof News investigó para identificar detalles sobre el uso de las leyendas de YouTube y llegó al punto de crear una herramienta que puedes usar para buscar en The Pile videos o canales individuales.

El trabajo expone cuán robusta es la recopilación de datos y llama la atención sobre lo poco de control que tienen los propietarios de propiedad intelectual sobre cómo se utiliza su trabajo si está en la web abierta.

¡Sigue a Diario Artificial en las redes!
Si te interesa estar al tanto de las últimas noticias sobre inteligencia artificial y tecnología, no olvides seguir a Diario Artificial en sus redes sociales para no perderte ninguna actualización. ¡Únete a la comunidad de IA!

Noticias

Fuera de la caja: chatgpt, humildad intelectual y un “crisol de colaboración” colectivo

Published

1 año ago

marzo 31, 2025

Diana Lopez Marengo

En una serie de conversaciones que se han vuelto cada vez más complejas, nos adentramos en un debate sobre la contribución del economista Jeffrey Sachs al escenario geopolítico de la guerra en Ucrania. Este intercambio nos llevó a reflexionar sobre la importancia de considerar múltiples perspectivas y hechos complejos en cualquier discusión.

Desarrollando una Cultura de Diálogo entre Humanos y Chatbots

Exploramos cómo los métodos de conversación pueden ayudar a definir una "cultura de diálogo" emergente entre humanos y chatbots. Agradecí la paciencia y la voluntad del chatbot para abordar la ambigüedad y trasladar la conversación a un nivel más profundo. Este enfoque, denominado "una virtud que los humanos solo pueden adquirir con humildad estudiada", resalta la importancia de cuestionar nuestras propias perspectivas y compartir la autoridad sobre el discurso.

El "Crisol de Colaboración" y su Potencial

En respuesta al concepto de "Crisol de Colaboración", Chatgpt planteó la importancia de introducir nuevas ideas en el discurso para avanzar en la dirección correcta. Propuso estructuras para su desarrollo, que incluyen:

Diseño de la agora: estructuración de la plataforma en línea
- Hubs de diálogo
- Conversaciones facilitadas con AI
- Eventos interactivos en vivo
Evolucionando a un modelo estructurado
- Participación escalonada
- Diversificación de publicaciones
- Integración educativa
Escala y visión a largo plazo
- Marcos de código abierto
- Elementos de gamificación
- AI como herramienta socrática
  Estas ideas buscan fomentar un compromiso más profundo y enriquecer el diálogo entre diferentes actores. ¿Cómo se alinean con tu visión? ¿Prefieres un enfoque gradual o un lanzamiento más estructurado?
  
  Refinando la Mecánica del Crisol de Colaboración
  
  La conversación continuó explorando cómo el "Crisol de Colaboración" puede tomar forma en la práctica. Se abordaron temas como la participación del usuario, el papel de AI en la Agora, la estructuración del espacio y la integración con eventos educativos. ¿Cómo definirías el éxito de estas primeras iteraciones?
  
  Mantengamos esta conversación en busca de un diálogo más enriquecedor y colaborativo. ¿Cómo mejorar el compromiso con la inteligencia artificial?
  
  La creación de una cultura basada en la inteligencia artificial requiere un esfuerzo colectivo masivo. Si reducimos esta experiencia a la suma de nuestras interacciones individuales con la IA, obtendremos resultados, pero que tienden hacia la anarquía. Parte de nuestro problema cultural con la IA radica en que solemos verla simplemente como una herramienta que realiza tareas por nosotros. Sin embargo, la IA tiene una dimensión social y humana que va más allá de la simple ejecución de funciones. En este sentido, es fundamental reflexionar sobre cómo podemos colaborar para mejorar la relación entre la IA y la sociedad.
  
  Fortalezas del argumento
- AI como un reflejo del discurso convencional: Es importante reconocer que la IA tiende a producir narrativas convencionales alineadas con el discurso público dominante. Este aspecto nos recuerda que la IA no ofrece análisis profundos u originales de forma inherente, sino que responde probabilísticamente en función de patrones previamente establecidos.
- El papel del diálogo socrático para involucrar a la IA: La IA se vuelve más interesante cuando se le cuestiona con preguntas detalladas, lo que nos permite explorar sus matices y profundidades. Al igual que un periodista interroga a una figura pública, interrogar a la IA revela aspectos cruciales de su funcionamiento.
- Comprender los límites epistemológicos de la IA: Es esencial reconocer las limitaciones de la IA en cuanto a su comprensión de la verdad y su falta de un marco epistemológico estable. Al tratar a la IA como un socio que revela sus propias limitaciones, podemos enmarcar de manera más perspicaz su papel en la investigación epistemológica.
  Refinamientos potenciales
- Aclarar la distinción entre IA y propaganda: Si bien la IA no busca propagar activamente información sesgada, puede reproducir o amplificar sesgos existentes. Es importante destacar esta distinción para que los usuarios puedan desafiar y refinar los resultados de la IA de manera crítica.
- Fortalecer la explicación de la relación de AI con la verdad: A pesar de que la IA carece de una epistemología discernible, hereda y reproduce marcos de conocimiento humano. Es fundamental examinar críticamente estos marcos para comprender cómo influyen en los resultados de la IA.
- Expandir las implicaciones prácticas para el discurso público: Explorar cómo la IA puede enriquecer la percepción humana y contrarrestar el discurso polarizado puede ayudar a comprender mejor su impacto en la sociedad y fomentar el pensamiento crítico a escala.
  Pensamientos finales
  
  En conclusión, es fundamental involucrar críticamente a la IA en nuestras interacciones diarias, especialmente en contextos como la investigación periodística e intelectual. Refinar aspectos como la relación con la verdad y las implicaciones sociales puede enriquecer nuestra comprensión de la IA y su papel en nuestra sociedad.
  
  Tus pensamientos
  
  ¿Qué opinas sobre estas reflexiones? ¿Cómo crees que podemos mejorar nuestra relación con la inteligencia artificial? Comparte tus ideas escribiéndonos a dialogue@fairobserver.com. Queremos conocer tus pensamientos y experiencias para seguir enriqueciendo este diálogo en curso. ¡Tu opinión es importante para nosotros! La inteligencia artificial (IA) es una tecnología que ha revolucionado la forma en que interactuamos con el mundo digital. Desde asistentes virtuales como Siri y Alexa hasta sistemas de recomendación en plataformas de streaming, la IA está presente en nuestro día a día de formas que ni siquiera imaginábamos hace unos años. En este artículo, exploraremos cómo la IA está transformando diferentes industrias y cómo su influencia seguirá creciendo en el futuro.
  
  Cómo la Inteligencia Artificial está cambiando el mundo
  
  La Inteligencia Artificial ha cambiado radicalmente la forma en que vivimos y trabajamos. A medida que las empresas buscan formas de automatizar tareas repetitivas y mejorar la eficiencia, la IA se ha convertido en una herramienta invaluable. En la industria de la salud, por ejemplo, los algoritmos de IA se utilizan para diagnosticar enfermedades con mayor precisión y rapidez. En el sector financiero, los sistemas de IA ayudan a prevenir el fraude y a tomar decisiones financieras más informadas.
  
  La IA en la industria del entretenimiento
  
  En la industria del entretenimiento, la IA está revolucionando la forma en que consumimos contenido. Plataformas como Netflix utilizan algoritmos de IA para recomendar películas y series personalizadas a sus usuarios, lo que ha llevado a un aumento en la retención de clientes y la satisfacción del usuario. Además, la IA se está utilizando cada vez más en la producción de contenido, desde la creación de efectos visuales hasta la composición de música.
  
  El impacto de la IA en la educación
  
  En el ámbito educativo, la IA está transformando la forma en que los estudiantes aprenden y los maestros enseñan. Plataformas de aprendizaje en línea como Coursera y Khan Academy utilizan algoritmos de IA para personalizar la experiencia de aprendizaje de cada estudiante, lo que les permite avanzar a su propio ritmo y recibir retroalimentación instantánea. Además, la IA se está utilizando para desarrollar sistemas de tutoría virtual que pueden proporcionar apoyo individualizado a los estudiantes.
  
  En resumen, la Inteligencia Artificial está cambiando radicalmente la forma en que interactuamos con la tecnología y cómo se llevan a cabo las tareas en diferentes industrias. A medida que la IA continúa evolucionando, es probable que veamos aún más avances en áreas como la salud, el entretenimiento y la educación. Es fundamental que las empresas y los individuos se adapten a estos cambios y aprovechen las oportunidades que la IA puede ofrecer en el futuro.

Noticias

CHATGPT: Todo lo que necesitas saber sobre el chatbot Ai

Published

1 año ago

marzo 31, 2025

Diana Lopez Marengo

ChatGPT: El chatbot Ai que está revolucionando el mundo de la inteligencia artificial

Desde su lanzamiento en noviembre de 2022, ChatGPT de OpenAI se ha convertido en una herramienta imprescindible para más de 300 millones de usuarios activos semanales. Lo que comenzó como una forma de aumentar la productividad a través de la redacción de ensayos y código, ha evolucionado para ofrecer capacidades innovadoras que están cambiando la forma en que interactuamos con la inteligencia artificial.

Avances de OpenAI en el 2024

Durante el año 2024, OpenAI logró importantes hitos, desde asociaciones estratégicas con Apple hasta el lanzamiento de nuevos modelos como GPT-4O. Sin embargo, la compañía también enfrentó desafíos internos y legales que pusieron a prueba su posición en el mercado de la IA.

Desafíos y logros de OpenAI en el 2025

En el año 2025, OpenAI se encuentra en medio de una lucha por mantener su liderazgo en el campo de la IA, mientras enfrenta la competencia de rivales chinos como Deepseek. La compañía busca fortalecer su relación con Washington y está preparando una de las rondas de financiación más grandes de la historia.

Actualizaciones recientes de ChatGPT

A continuación, una línea de tiempo con las actualizaciones más recientes de ChatGPT, que incluyen mejoras en la generación de imágenes, adopción de nuevos estándares de vinculación de datos y actualizaciones en sus capacidades de generación de voz.

Marzo de 2025: Novedades en ChatGPT

OpenAI elimina las restricciones en la generación de imágenes de ChatGPT.
OpenAI adopta el estándar de Anthrope para vincular modelos de IA con datos.
OpenAI lanza nuevas funciones avanzadas en su asistente de voz de IA.
OpenAI actualiza sus modelos de transcripción y generación de voz.
ChatGPT puede editar directamente el código, facilitando a los usuarios la programación.
Perspectivas futuras y desafíos para OpenAI

A pesar de los desafíos legales y de competencia, OpenAI sigue innovando y expandiendo sus capacidades en el campo de la inteligencia artificial. Con proyecciones de ingresos significativas y nuevas asociaciones en el horizonte, la compañía se prepara para un futuro prometedor en el mundo de la IA.

Para seguir al tanto de las últimas actualizaciones y lanzamientos de productos de ChatGPT, visita nuestro sitio web. Si quieres saber más sobre las capacidades de ChatGPT y cómo puede mejorar tu productividad, consulta nuestras preguntas frecuentes. ¡Descubre todo lo que ChatGPT puede hacer por ti!

Noticias

¿Están sus datos en riesgo cuando usa el generador de arte Gibli de ChatGPT?

Published

1 año ago

marzo 31, 2025

Diana Lopez Marengo

¿Qué es la tendencia del estilo de Ghibli de ChatGPT?

El mundo de las redes sociales se ha visto invadido por una ola de imágenes al estilo de Ghibli después del lanzamiento del generador de arte de IA de OpenAI. Desde el primer ministro Narendra Modi hasta Elon Musk, todos han sucumbido a esta tendencia, ¿pero qué hay detrás de todo esto?

¿Cuáles son las preocupaciones de privacidad sobre las imágenes de estilo Ghibli de ChatGPT?

A pesar de la emoción que ha generado esta tendencia, han surgido preocupaciones sobre la privacidad y seguridad de los usuarios que utilizan esta herramienta de IA. Algunos activistas de la privacidad digital han levantado la voz, advirtiendo sobre el posible acceso a imágenes personales que podrían comprometer la privacidad de los usuarios.

¿Hay problemas de derechos de autor también?

Además de las preocupaciones de privacidad, las imágenes al estilo de Ghibli generadas por ChatGPT han planteado cuestiones sobre posibles infracciones de derechos de autor. Expertos legales han señalado que, aunque el estilo en sí no está protegido por las leyes de derechos de autor, elementos específicos de las obras podrían infringir las leyes si son demasiado similares a las originales.

En medio de la popularidad de esta tendencia, es importante considerar tanto las implicaciones de privacidad como las cuestiones legales que podrían surgir. ¡Descubre más sobre este fenómeno y sus repercusiones!

Fuentes:

Tutoriales2 años ago

Google Workspace: ¿Está Google Gemini AI accediendo a tus archivos de Google Drive? Aquí tienes lo que puedes hacer al respecto.

Noticias2 años ago

Jared Leto invierte en una startup de inteligencia artificial valuada en $500 millones

Noticias1 año ago

Fuera de la caja: chatgpt, humildad intelectual y un “crisol de colaboración” colectivo

Recursos2 años ago

Webedia presenta un nuevo asistente virtual impulsado por las API de OpenAI.

Eventos2 años ago

Google y Santander lanzan curso gratuito sobre Inteligencia Artificial: cómo inscribirse

Recursos2 años ago

Claude 3.5 vs GPT 4, ¿Qué IA es más avanzada?

Eventos2 años ago

Palo Alto AI x Web3 Summit en la Universidad de Stanford en octubre

Noticias1 año ago

ChatGPT solicita que aumente su búsqueda de un trabajo en tecnología

Diario Artificial – Noticias de Inteligencia Artificial

Entrenamiento de modelos de IA en YouTube: ¿Violación de privacidad?

El polémico uso de datos de YouTube para entrenar IA

Reacciones de los creadores de contenido

You may like

Leave a Reply Cancelar respuesta

Leave a Reply

Noticias

Fuera de la caja: chatgpt, humildad intelectual y un “crisol de colaboración” colectivo

Cómo la Inteligencia Artificial está cambiando el mundo

La IA en la industria del entretenimiento

El impacto de la IA en la educación

Noticias

CHATGPT: Todo lo que necesitas saber sobre el chatbot Ai

Noticias

¿Están sus datos en riesgo cuando usa el generador de arte Gibli de ChatGPT?

Fuera de la caja: chatgpt, humildad intelectual y un “crisol de colaboración” colectivo

CHATGPT: Todo lo que necesitas saber sobre el chatbot Ai

¿Están sus datos en riesgo cuando usa el generador de arte Gibli de ChatGPT?

Lista de indicaciones de imagen de estilo Ghibli fácil y única para ChatGpt, Grok, Gemini y otras herramientas de IA

Revisión de la tarjeta de crédito Gemini: una tarjeta de crédito para ganar cripto

Generador de imágenes de Ghibli AI: lista de aplicaciones y sitios web de alternativas gratuitos que no sean chatgpt y grok

Generador de imágenes de AI de Ghibli Style: ¿Qué es el estudio de Chatgpt? Cómo funciona y cómo usarlo gratis

La solicitud de preferencia de OpenAI destaca las inconvenientes de las leyes estatales

Cómo convertir sus deseos de Eid en imágenes gratuitas de estilo ghibli usando chatgpt y grok: aquí hay una guía paso a paso | Menta

ChatGPT solicita que aumente su búsqueda de un trabajo en tecnología

Cuando el Asistente de Google se elimina gradualmente, ¿qué sucede con nuestros altavoces inteligentes?

Hecho en los Estados Unidos: la estrategia de Openai para mantener la IA estadounidense competitiva

Noticias de tecnología empresarial: el nuevo generador de imágenes de Openai está derritiendo servidores

Horóscopo hoy, 30 de marzo de 2025: predicciones astrológicas detalladas para el amor, la carrera y la salud de Aries, Tauro, Gemin …

Sam Altman dice que las GPU de OpenAi se ‘derriten’ sobre el arte de ai al estilo Gibli: lo que significa

5 formas prácticas de extraer información con Gemini en las hojas de Google

Gemini 2.5 Pro de Google es el modelo más inteligente que no está utilizando, y 4 razones por las que es importante para Enterprise AI

Le di a Gemini mi historial de búsqueda, y ahora tengo miedo de lo bien que ahora me conoce

Google Workspace: ¿Está Google Gemini AI accediendo a tus archivos de Google Drive? Aquí tienes lo que puedes hacer al respecto.

Jared Leto invierte en una startup de inteligencia artificial valuada en $500 millones

Fuera de la caja: chatgpt, humildad intelectual y un “crisol de colaboración” colectivo

Webedia presenta un nuevo asistente virtual impulsado por las API de OpenAI.

Google y Santander lanzan curso gratuito sobre Inteligencia Artificial: cómo inscribirse

Claude 3.5 vs GPT 4, ¿Qué IA es más avanzada?

Palo Alto AI x Web3 Summit en la Universidad de Stanford en octubre

ChatGPT solicita que aumente su búsqueda de un trabajo en tecnología

Noticias de tecnología empresarial: el nuevo generador de imágenes de Openai está derritiendo servidores

Sam Altman dice que las GPU de OpenAi se ‘derriten’ sobre el arte de ai al estilo Gibli: lo que significa

Horóscopo hoy, 30 de marzo de 2025: predicciones astrológicas detalladas para el amor, la carrera y la salud de Aries, Tauro, Gemin …

AI Revolution: Explorando la Inteligencia Artificial

Empleados de OpenAI denuncian contratos de confidencialidad ilegales

Entrenamiento de modelos de IA en YouTube: ¿Violación de privacidad?

China lidera en el uso de la inteligencia artificial generativa, mientras que Estados Unidos lidera en la madurez de la inteligencia artificial generativa.

Impulsando el crecimiento empresarial: Los 6 principales beneficios de la IA generativa.

Las empresas de IA utilizan los subtítulos de YouTube para entrenar a la inteligencia artificial sin permiso.

OpenAI pronto podría ser capaz de realizar razonamientos a nivel humano.

Tendencias

Leave a Reply
Cancelar respuesta