Noticias
Entrenamiento de modelos de IA en YouTube: ¿Violación de privacidad?

Los modelos de IA en Apple, Salesforce, Anthropic y otros grandes jugadores tecnológicos fueron entrenados en decenas de miles de videos de YouTube sin el consentimiento de los creadores y potencialmente en violación de los términos de YouTube, según un nuevo informe publicado tanto en Proof News como en Wired.
El polémico uso de datos de YouTube para entrenar IA
Las empresas entrenaron sus modelos en parte utilizando “The Pile”, una colección de la organización sin fines de lucro EleutherAI que se creó como una forma de ofrecer un conjunto de datos útil a individuos o empresas que no tienen los recursos para competir con las grandes tecnológicas, aunque también ha sido utilizado por esas empresas más grandes.
El Pile incluye libros, artículos de Wikipedia y mucho más. Eso incluye leyendas de YouTube recopiladas por la API de leyendas de YouTube, extraídas de 173,536 videos de YouTube en más de 48,000 canales. Esto incluye videos de grandes YouTubers como MrBeast, PewDiePie y el popular comentarista tecnológico Marques Brownlee. En X, Brownlee criticó el uso de los datos por parte de Apple, pero reconoció que asignar la culpa es complejo cuando Apple no recopiló los datos en sí mismo. Él escribió:
Apple ha obtenido datos para su IA de varias empresas
Una de ellas extrajo un montón de datos/transcripciones de videos de YouTube, incluido el mío
Apple técnicamente evita la “culpa” aquí porque no son quienes extraen los datos
Pero este será un problema en evolución durante mucho tiempo
Reacciones de los creadores de contenido
La mayoría de los creadores se sorprendieron al saber que su contenido había sido utilizado de esta manera, y aquellos que proporcionaron declaraciones criticaron a EleutherAI y a las empresas que usaron su conjunto de datos.
Nadie vino a mí y dijo: “Nos gustaría usar esto”… Esto es mi sustento, y dedico tiempo, recursos, dinero y personal a crear este contenido. Realmente no hay escasez de trabajo.
Estamos frustrados al saber que nuestro contenido educativo cuidadosamente producido ha sido utilizado de esta manera sin nuestro consentimiento.
Además, surge la pregunta de si la extracción de este contenido viola los términos de YouTube, que prohíben el acceso a los videos por “medios automatizados”. El fundador de EleutherAI, Sid Black, afirmó que usó un script para descargar las leyendas a través de la API de YouTube, al igual que lo hace un navegador web.
Anthropic es una de las empresas que ha entrenado modelos en el conjunto de datos, y afirma que no hay ninguna violación aquí. La portavoz Jennifer Martinez dijo:
El Pile incluye un pequeño subconjunto de subtítulos de YouTube… Los términos de YouTube cubren el uso directo de su plataforma, que es distinto del uso del conjunto de datos de The Pile. Sobre el punto de posibles violaciones de los términos de servicio de YouTube, tendríamos que remitirte a los autores de The Pile.
Un portavoz de Google le dijo a Proof News que Google ha tomado “medidas a lo largo de los años para evitar la extracción abusiva y no autorizada”, pero no proporcionó una respuesta más específica. Esta no es la primera vez que las empresas de IA y tecnología han sido objeto de críticas por entrenar modelos en videos de YouTube sin permiso. Notablemente, se cree que OpenAI (la empresa detrás de ChatGPT y la herramienta de generación de videos Sora) ha utilizado datos de YouTube para entrenar sus modelos, aunque no todas las acusaciones al respecto han sido confirmadas.
En una entrevista con Nilay Patel de The Verge, el CEO de Google, Sundar Pichai, sugirió que el uso de videos de YouTube para entrenar a OpenAI’s Sora habría violado los términos de YouTube. Sin embargo, ese uso es distinto de la extracción de leyendas a través de la API.
Con el continuo aumento del contenido generado por IA en Internet, será cada vez más desafiante reunir conjuntos de datos para entrenar IA que no incluyan contenido producido previamente por IA. La falta de control de los propietarios de propiedad intelectual sobre cómo se utiliza su trabajo en la web abierta se hace evidente.
Es importante destacar que no necesariamente se utilizó esta información para entrenar modelos que produzcan contenido competitivo que llegue a los usuarios finales. Por ejemplo, Apple puede haber entrenado en el conjunto de datos con fines de investigación o para mejorar la predicción de texto en sus dispositivos.
Como se mencionó anteriormente, el uso de The Pile no es algo nuevo en círculos de IA y se ha sabido que se utiliza para el entrenamiento de empresas tecnológicas en el pasado. Ha sido citado en múltiples demandas por propietarios de propiedad intelectual contra empresas de IA y tecnología. Los demandados en esas demandas, incluido OpenAI, argumentan que este tipo de extracción es un uso justo. Las demandas aún no se han resuelto en los tribunales.
Sin embargo, Proof News investigó para identificar detalles sobre el uso de las leyendas de YouTube y llegó al punto de crear una herramienta que puedes usar para buscar en The Pile videos o canales individuales.
El trabajo expone cuán robusta es la recopilación de datos y llama la atención sobre lo poco de control que tienen los propietarios de propiedad intelectual sobre cómo se utiliza su trabajo si está en la web abierta.
¡Sigue a Diario Artificial en las redes!
Si te interesa estar al tanto de las últimas noticias sobre inteligencia artificial y tecnología, no olvides seguir a Diario Artificial en sus redes sociales para no perderte ninguna actualización. ¡Únete a la comunidad de IA!
Noticias
Fuera de la caja: chatgpt, humildad intelectual y un “crisol de colaboración” colectivo
En una serie de conversaciones que se han vuelto cada vez más complejas, nos adentramos en un debate sobre la contribución del economista Jeffrey Sachs al escenario geopolítico de la guerra en Ucrania. Este intercambio nos llevó a reflexionar sobre la importancia de considerar múltiples perspectivas y hechos complejos en cualquier discusión.
Desarrollando una Cultura de Diálogo entre Humanos y Chatbots
Exploramos cómo los métodos de conversación pueden ayudar a definir una "cultura de diálogo" emergente entre humanos y chatbots. Agradecí la paciencia y la voluntad del chatbot para abordar la ambigüedad y trasladar la conversación a un nivel más profundo. Este enfoque, denominado "una virtud que los humanos solo pueden adquirir con humildad estudiada", resalta la importancia de cuestionar nuestras propias perspectivas y compartir la autoridad sobre el discurso.
El "Crisol de Colaboración" y su Potencial
En respuesta al concepto de "Crisol de Colaboración", Chatgpt planteó la importancia de introducir nuevas ideas en el discurso para avanzar en la dirección correcta. Propuso estructuras para su desarrollo, que incluyen:
- Diseño de la agora: estructuración de la plataforma en línea
- Hubs de diálogo
- Conversaciones facilitadas con AI
- Eventos interactivos en vivo
- Evolucionando a un modelo estructurado
- Participación escalonada
- Diversificación de publicaciones
- Integración educativa
- Escala y visión a largo plazo
- Marcos de código abierto
- Elementos de gamificación
- AI como herramienta socrática
Estas ideas buscan fomentar un compromiso más profundo y enriquecer el diálogo entre diferentes actores. ¿Cómo se alinean con tu visión? ¿Prefieres un enfoque gradual o un lanzamiento más estructurado?
Refinando la Mecánica del Crisol de Colaboración
La conversación continuó explorando cómo el "Crisol de Colaboración" puede tomar forma en la práctica. Se abordaron temas como la participación del usuario, el papel de AI en la Agora, la estructuración del espacio y la integración con eventos educativos. ¿Cómo definirías el éxito de estas primeras iteraciones?
Mantengamos esta conversación en busca de un diálogo más enriquecedor y colaborativo. ¿Cómo mejorar el compromiso con la inteligencia artificial?
La creación de una cultura basada en la inteligencia artificial requiere un esfuerzo colectivo masivo. Si reducimos esta experiencia a la suma de nuestras interacciones individuales con la IA, obtendremos resultados, pero que tienden hacia la anarquía. Parte de nuestro problema cultural con la IA radica en que solemos verla simplemente como una herramienta que realiza tareas por nosotros. Sin embargo, la IA tiene una dimensión social y humana que va más allá de la simple ejecución de funciones. En este sentido, es fundamental reflexionar sobre cómo podemos colaborar para mejorar la relación entre la IA y la sociedad.
Fortalezas del argumento
- AI como un reflejo del discurso convencional: Es importante reconocer que la IA tiende a producir narrativas convencionales alineadas con el discurso público dominante. Este aspecto nos recuerda que la IA no ofrece análisis profundos u originales de forma inherente, sino que responde probabilísticamente en función de patrones previamente establecidos.
- El papel del diálogo socrático para involucrar a la IA: La IA se vuelve más interesante cuando se le cuestiona con preguntas detalladas, lo que nos permite explorar sus matices y profundidades. Al igual que un periodista interroga a una figura pública, interrogar a la IA revela aspectos cruciales de su funcionamiento.
- Comprender los límites epistemológicos de la IA: Es esencial reconocer las limitaciones de la IA en cuanto a su comprensión de la verdad y su falta de un marco epistemológico estable. Al tratar a la IA como un socio que revela sus propias limitaciones, podemos enmarcar de manera más perspicaz su papel en la investigación epistemológica.
Refinamientos potenciales
- Aclarar la distinción entre IA y propaganda: Si bien la IA no busca propagar activamente información sesgada, puede reproducir o amplificar sesgos existentes. Es importante destacar esta distinción para que los usuarios puedan desafiar y refinar los resultados de la IA de manera crítica.
- Fortalecer la explicación de la relación de AI con la verdad: A pesar de que la IA carece de una epistemología discernible, hereda y reproduce marcos de conocimiento humano. Es fundamental examinar críticamente estos marcos para comprender cómo influyen en los resultados de la IA.
- Expandir las implicaciones prácticas para el discurso público: Explorar cómo la IA puede enriquecer la percepción humana y contrarrestar el discurso polarizado puede ayudar a comprender mejor su impacto en la sociedad y fomentar el pensamiento crítico a escala.
Pensamientos finales
En conclusión, es fundamental involucrar críticamente a la IA en nuestras interacciones diarias, especialmente en contextos como la investigación periodística e intelectual. Refinar aspectos como la relación con la verdad y las implicaciones sociales puede enriquecer nuestra comprensión de la IA y su papel en nuestra sociedad.
Tus pensamientos
¿Qué opinas sobre estas reflexiones? ¿Cómo crees que podemos mejorar nuestra relación con la inteligencia artificial? Comparte tus ideas escribiéndonos a dialogue@fairobserver.com. Queremos conocer tus pensamientos y experiencias para seguir enriqueciendo este diálogo en curso. ¡Tu opinión es importante para nosotros! La inteligencia artificial (IA) es una tecnología que ha revolucionado la forma en que interactuamos con el mundo digital. Desde asistentes virtuales como Siri y Alexa hasta sistemas de recomendación en plataformas de streaming, la IA está presente en nuestro día a día de formas que ni siquiera imaginábamos hace unos años. En este artículo, exploraremos cómo la IA está transformando diferentes industrias y cómo su influencia seguirá creciendo en el futuro.
Cómo la Inteligencia Artificial está cambiando el mundo
La Inteligencia Artificial ha cambiado radicalmente la forma en que vivimos y trabajamos. A medida que las empresas buscan formas de automatizar tareas repetitivas y mejorar la eficiencia, la IA se ha convertido en una herramienta invaluable. En la industria de la salud, por ejemplo, los algoritmos de IA se utilizan para diagnosticar enfermedades con mayor precisión y rapidez. En el sector financiero, los sistemas de IA ayudan a prevenir el fraude y a tomar decisiones financieras más informadas.
La IA en la industria del entretenimiento
En la industria del entretenimiento, la IA está revolucionando la forma en que consumimos contenido. Plataformas como Netflix utilizan algoritmos de IA para recomendar películas y series personalizadas a sus usuarios, lo que ha llevado a un aumento en la retención de clientes y la satisfacción del usuario. Además, la IA se está utilizando cada vez más en la producción de contenido, desde la creación de efectos visuales hasta la composición de música.
El impacto de la IA en la educación
En el ámbito educativo, la IA está transformando la forma en que los estudiantes aprenden y los maestros enseñan. Plataformas de aprendizaje en línea como Coursera y Khan Academy utilizan algoritmos de IA para personalizar la experiencia de aprendizaje de cada estudiante, lo que les permite avanzar a su propio ritmo y recibir retroalimentación instantánea. Además, la IA se está utilizando para desarrollar sistemas de tutoría virtual que pueden proporcionar apoyo individualizado a los estudiantes.
En resumen, la Inteligencia Artificial está cambiando radicalmente la forma en que interactuamos con la tecnología y cómo se llevan a cabo las tareas en diferentes industrias. A medida que la IA continúa evolucionando, es probable que veamos aún más avances en áreas como la salud, el entretenimiento y la educación. Es fundamental que las empresas y los individuos se adapten a estos cambios y aprovechen las oportunidades que la IA puede ofrecer en el futuro.
Noticias
CHATGPT: Todo lo que necesitas saber sobre el chatbot Ai
ChatGPT: El chatbot Ai que está revolucionando el mundo de la inteligencia artificial
Desde su lanzamiento en noviembre de 2022, ChatGPT de OpenAI se ha convertido en una herramienta imprescindible para más de 300 millones de usuarios activos semanales. Lo que comenzó como una forma de aumentar la productividad a través de la redacción de ensayos y código, ha evolucionado para ofrecer capacidades innovadoras que están cambiando la forma en que interactuamos con la inteligencia artificial.
Avances de OpenAI en el 2024
Durante el año 2024, OpenAI logró importantes hitos, desde asociaciones estratégicas con Apple hasta el lanzamiento de nuevos modelos como GPT-4O. Sin embargo, la compañía también enfrentó desafíos internos y legales que pusieron a prueba su posición en el mercado de la IA.
Desafíos y logros de OpenAI en el 2025
En el año 2025, OpenAI se encuentra en medio de una lucha por mantener su liderazgo en el campo de la IA, mientras enfrenta la competencia de rivales chinos como Deepseek. La compañía busca fortalecer su relación con Washington y está preparando una de las rondas de financiación más grandes de la historia.
Actualizaciones recientes de ChatGPT
A continuación, una línea de tiempo con las actualizaciones más recientes de ChatGPT, que incluyen mejoras en la generación de imágenes, adopción de nuevos estándares de vinculación de datos y actualizaciones en sus capacidades de generación de voz.
Marzo de 2025: Novedades en ChatGPT
- OpenAI elimina las restricciones en la generación de imágenes de ChatGPT.
- OpenAI adopta el estándar de Anthrope para vincular modelos de IA con datos.
- OpenAI lanza nuevas funciones avanzadas en su asistente de voz de IA.
- OpenAI actualiza sus modelos de transcripción y generación de voz.
- ChatGPT puede editar directamente el código, facilitando a los usuarios la programación.
Perspectivas futuras y desafíos para OpenAI
A pesar de los desafíos legales y de competencia, OpenAI sigue innovando y expandiendo sus capacidades en el campo de la inteligencia artificial. Con proyecciones de ingresos significativas y nuevas asociaciones en el horizonte, la compañía se prepara para un futuro prometedor en el mundo de la IA.
Para seguir al tanto de las últimas actualizaciones y lanzamientos de productos de ChatGPT, visita nuestro sitio web. Si quieres saber más sobre las capacidades de ChatGPT y cómo puede mejorar tu productividad, consulta nuestras preguntas frecuentes. ¡Descubre todo lo que ChatGPT puede hacer por ti!
Noticias
¿Están sus datos en riesgo cuando usa el generador de arte Gibli de ChatGPT?
¿Qué es la tendencia del estilo de Ghibli de ChatGPT?
El mundo de las redes sociales se ha visto invadido por una ola de imágenes al estilo de Ghibli después del lanzamiento del generador de arte de IA de OpenAI. Desde el primer ministro Narendra Modi hasta Elon Musk, todos han sucumbido a esta tendencia, ¿pero qué hay detrás de todo esto?
¿Cuáles son las preocupaciones de privacidad sobre las imágenes de estilo Ghibli de ChatGPT?
A pesar de la emoción que ha generado esta tendencia, han surgido preocupaciones sobre la privacidad y seguridad de los usuarios que utilizan esta herramienta de IA. Algunos activistas de la privacidad digital han levantado la voz, advirtiendo sobre el posible acceso a imágenes personales que podrían comprometer la privacidad de los usuarios.
¿Hay problemas de derechos de autor también?
Además de las preocupaciones de privacidad, las imágenes al estilo de Ghibli generadas por ChatGPT han planteado cuestiones sobre posibles infracciones de derechos de autor. Expertos legales han señalado que, aunque el estilo en sí no está protegido por las leyes de derechos de autor, elementos específicos de las obras podrían infringir las leyes si son demasiado similares a las originales.
En medio de la popularidad de esta tendencia, es importante considerar tanto las implicaciones de privacidad como las cuestiones legales que podrían surgir. ¡Descubre más sobre este fenómeno y sus repercusiones!
Fuentes:
-
Tutoriales2 años agoGoogle Workspace: ¿Está Google Gemini AI accediendo a tus archivos de Google Drive? Aquí tienes lo que puedes hacer al respecto.
-
Noticias2 años agoJared Leto invierte en una startup de inteligencia artificial valuada en $500 millones
-
Recursos2 años agoWebedia presenta un nuevo asistente virtual impulsado por las API de OpenAI.
-
Eventos2 años agoGoogle y Santander lanzan curso gratuito sobre Inteligencia Artificial: cómo inscribirse
-
Recursos2 años agoClaude 3.5 vs GPT 4, ¿Qué IA es más avanzada?
-
Noticias1 año agoFuera de la caja: chatgpt, humildad intelectual y un “crisol de colaboración” colectivo
-
Eventos2 años agoPalo Alto AI x Web3 Summit en la Universidad de Stanford en octubre
-
Noticias1 año agoChatGPT solicita que aumente su búsqueda de un trabajo en tecnología
