Xiaomi desarrolla una tecnología de voz propia para ayudar a las personas con trastornos del habla

El proyecto "Own My Voice" permite a los receptores poseer voces únicas y personalizadas

Xiaomi, compañía líder de tecnología a nivel global, ha presentado su última aplicación de algoritmos avanzados y tecnología de voz de desarrollo propio para aplicarla al campo de la accesibilidad. La tecnología Text-To-Speech, desarrollada por Xiaomi AI Lab, permite generar una voz única y personalizada para usuarios con trastornos del habla.

Gracias a estos avances, los usuarios pueden comunicarse utilizando «su propia voz», en lugar de la típica y monótona voz electrónica. El proyecto de pre investigación «Own My Voice«, dirigido por el Comité Técnico de Xiaomi, este exitoso avance demuestra el compromiso de Xiaomi con «Tech for Good» y con la consecución de su misión de «ofrecer la posibilidad de que todos disfruten de una vida mejor a través de la innovación tecnológica».

¿Por qué ha lanzado Xiaomi este proyecto?

Xiaomi se preocupa por las personas y se esfuerza por satisfacer sus diferentes necesidades mediante la innovación tecnológica. La compañía comprendió el deseo de muchos usuarios con trastornos del habla de poseer sus “propias voces” y formó el equipo del proyecto «Own My Voice».

Nos entusiasma explorar los múltiples valores que nos aporta la innovación tecnológica, como responder a las demandas de los usuarios en cuanto a la identidad propia.Zhu Xi, Presidente del Comité de Tech for Good, de Xiaomi Corporation

¿Cómo ha llevado a cabo Xiaomi este proyecto?

Para generar la voz más adecuada y personalizada para el destinatario, el equipo del proyecto reclutó a más de 200 voluntarios de Xiaomi para que “donaran sus voces”. Utilizaron el algoritmo de coincidencia de la huella vocal para comparar las características de las voces de los voluntarios con las de la voz del receptor. De este modo, encontraron la voz más adecuada como sonido básico de referencia para el destinatario. Teniendo en cuenta la personalización y la protección de la privacidad, la voz real elegida se manipuló con una compleja modificación acústica para formar un sonido de voz nuevo y original.

Después utilizaron la tecnología Text-To-Speech para entrenar el modelo de IA, haciendo que esta nueva voz adquiriera gradualmente un ritmo y una entonación naturales que pudieran expresar con veracidad la emoción y el tono de un ser humano.

El proyecto «Own My Voice» combina los algoritmos más avanzados con la tecnología de voz desarrollada por Xiaomi para garantizar la especificidad, seguridad y autenticidad de la voz sintetizada, creando una nueva idea de síntesis de voz personalizada para los usuarios con trastornos del habla.

¿Cuál es la importancia del proyecto?

La columna vertebral de este proyecto está formada por un grupo de expertos en tecnología del habla de Xiaomi AI Lab. Desde 2017, han publicado 37 artículos sobre el habla en las actas de las principales conferencias internacionales, como la Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales (ICASSP). El éxito de «Own My Voice» depende principalmente de la tecnología Text-To-Speech de estilo espontáneo desarrollada por ellos.

Te puede interesar

La Comisión Europea presenta el AI Continent Action Plan para impulsar la inteligencia artificial

La tecnología Text-To-Speech de estilo espontáneo hace que la voz sintetizada se parezca a la de un humano real en su entonación, pausa, velocidad y otras características. Así se sustituye la sensación monótona y antinatural de la voz electrónica por otra más natural. Actualmente, esta tecnología se aplica a muchos dispositivos inteligentes equipados con Xiaoai, el asistente de voz de IA de Xiaomi. El proyecto «Own My Voice» demuestra que la tecnología de texto a voz de estilo espontáneo también puede adoptarse ampliamente en áreas de accesibilidad y mejorar la experiencia del usuario.

Zhu Xi añadió: «Si advertimos y atendemos las necesidades de los grupos minoritarios en una fase temprana, el proceso de difusión de la tecnología podría acortarse en gran medida. Esto permite que los beneficios de las nuevas tecnologías sean accesibles a los usuarios con necesidades especiales”.

En el futuro, Xiaomi seguirá recibiendo las opiniones de los destinatarios de la voz y estudiará la viabilidad de este proyecto en un ámbito más amplio. Xiaomi seguirá potenciando la accesibilidad a través de la tecnología de vanguardia, esforzándose por satisfacer las diversas necesidades de las personas a través de la innovación tecnológica.

Etiquetas

Own My Voice tecnología voz xiaomi

Xiaomi desarrolla una tecnología de voz propia para ayudar a las personas con trastornos del habla

Bit2Me STX completa pruebas del bono tokenizado de Valorix ante la CNMV

Samsung activa IA visual en tiempo real en móviles Galaxy S25

El Gobierno aprueba el DNI digital para uso presencial a través de MiDNI

CIOs del IBEX 35 analizan la digitalización empresarial en ASLAN 2025

Servicios financieros embebidos e IA impulsan la digitalización bancaria en 2025

Huawei y Meliá avanzan en la digitalización hotelera con hoteles inteligentes

Colaboración de Gaia-X y empresas japonesas impulsa intercambio de datos

Europa impulsa su soberanía digital con Gaia-X y el Reglamento EHDS

Datos y digitalización: aliados estratégicos para el futuro del sector agrario

Startups españolas aplican IA sanitaria en programa de Google

OVHcloud selecciona las finalistas del Fast Forward AI Accelerator

Madrid lanza DesafIA para impulsar startups con retos tecnológicos

Huawei lanza los FreeBuds Pro 4 con cancelación de ruido y reproducción de audio sin pérdidas

HUAWEI FreeClip Rose Gold: funcionalidad y tecnología de audio avanzada

JBL lanza los Tour ONE M3 con SMART Tx y audio inmersivo

Cambium Networks se asocia con Nonius para establecer nuevos estándares en conectividad para hostelería

Xiaomi lleva un paso más allá la experiencia Smart Living con sus últimos productos de AIoT

ZTE anuncia el primer prototipo PON+Wi-Fi 7 ONU de la industria

Drones con inteligencia artificial redefinen la seguridad y el rescate

Serveo y Telefónica Tech inspeccionan con drones los accidentes de tráfico para la Comunidad de Madrid

Libera la creatividad con DJI Mini 4 Pro: la solución aérea todo en uno

Motorola edge 60 fusion con pantalla curvada Pantone y moto ai integrado

Google lanza el Pixel 9a con el chip Tensor G4 y Gemini integrado por 549 euros

Apple presenta el iPhone 16e con chip A18, 5G propio y Apple Intelligence

Lenovo lanza portátil con cámara bajo pantalla y OLED 4K de TCL CSOT

GIGABYTE establece nuevos estándares en computación de alto rendimiento en CES 2025

Así es el nuevo Dell: un portafolio más simple, potente y listo para la IA

Huawei MatePad Pro 13.2” 2025: características, precio y disponibilidad en España

Huawei lanza la MatePad Pro 12,2” con pantalla PaperMatte y funciones para diseñadores

Samsung lanza la serie Galaxy Tab S10 con Inteligencia Artificial integrada

Microsoft estrena «Power On: La historia de Xbox» disponible vía streaming

Samsung presenta mundialmente un nuevo monitor inteligente para el teletrabajo y el entretenimiento

Xiaomi lanza en España Mi Smart Antibacterial Humidifier y Mi Smart Space Heater S