Red de conocimiento de recetas - Recetas gastronómicas - ¿Cuál es el futuro lleno de sonido?

¿Cuál es el futuro lleno de sonido?

Clase de lectura temprana en inglés online

¡Atención 800.000 compañeros de Internet!

¡Céntrese en la selección del diseño de operación del producto!

Autor: Li? ¿escala? /p>

Fuente: Jianshu

Editor: Nizi Xiaoguliang

La ciudad no ha cambiado, pero la vida sí.

1. Estado actual del desarrollo del habla

La fonética es un tabú para muchas personas que simplemente quieren involucrarse en el campo de la inteligencia artificial, porque desde muchas perspectivas, el proceso de desarrollo de la fonética Es tortuoso y actualmente existen varias situaciones:

1. La implementación de la tecnología de voz es difícil y el proceso de preprocesamiento es complicado.

2. El corpus es insuficiente y pocas personas lo han estudiado.

3. Los recursos abiertos en todos los aspectos son relativamente escasos y el desarrollo es más lento.

En la era actual de Internet móvil, sigue siendo la principal forma de resolver problemas en la vida de las personas, y el medio son los teléfonos móviles, que utilizan interfaces para transmitir información. En los últimos años, la gente se ha acostumbrado a este método y de repente ha cambiado a un modo de voz sin interfaz, que es relativamente sencillo y lento a la hora de transmitir información. Habrá muchas contradicciones y su uso resultará extraño, dejando muchos productos muertos en las calles.

Aunque la inteligencia artificial ha recibido un fuerte apoyo, su tiempo de puesta en marcha aún es corto y la oferta de talento es difícil de satisfacer las necesidades de las empresas. Lo que las empresas quieren son ingenieros maduros que puedan comercializar tecnología en poco tiempo, lo que consume enormes recursos financieros y materiales. Los ingenieros en la etapa de transición o los estudiantes de carreras relacionadas no son suficientes para cumplir con este estándar, y su pronunciación es particularmente obvia, por lo que el mercado se encuentra en un estado de ansiedad impetuosa.

En segundo lugar, la voz es la entrada a la inteligencia artificial.

Pero significa que el sonido se desvanecerá gradualmente e incluso se convertirá en una burbuja a medida que se desarrolle. Creo que no solo eso, la voz es la verdadera entrada para que las personas acepten la inteligencia artificial, y también es el escenario más común y ampliamente utilizado en el futuro. La interfaz actual ofrece a las personas el espacio para elegir y la diversidad de entrada de información, pero las personas se ven cada vez más afectadas por ella, haciéndolas ineficientes, cansadas de elegir y fácilmente adictas.

Hablaré de lo anterior por separado.

1. ¿Por qué la voz es la entrada?

Si le preguntas a una persona normal, ¿crees que una imagen puede detectar el número de matrícula y una aplicación móvil puede mostrarte tus noticias y productos favoritos? ¿Es esto inteligencia artificial? Puede que no sepa si lo es. Quizás no notó estos cambios, pero si le preguntas, ¿es inteligencia artificial cuando una máquina habla como un humano? Afirmaría sin dudarlo, porque hablar es la forma más intuitiva y natural de juzgar a una persona, y la gente no entiende de algoritmos. No conozco datos, así que sé que esta máquina fría frente a mí puede comunicarse conmigo como un ser humano y ayudarme en la comunicación. Eso es inteligencia, por eso la voz es la entrada más adecuada.

2. ¿Por qué los escenarios de aplicaciones de voz serán los más extendidos en el futuro?

Con el entrenamiento continuo de modelos, los hospitales pueden determinar enfermedades a través de máquinas que escanean una gran cantidad de imágenes, la policía puede identificar sospechosos mediante la detección de rostros y las finanzas pueden predecir las acciones mediante algoritmos relacionados. Pero las escenas más adecuadas para el sonido son aquellas cercanas a la vida cotidiana, la educación, el derecho y la producción de las personas. Aunque se agregará la voz, el punto clave para que la máquina realmente resuelva las necesidades humanas no está aquí. Es para cambiar los métodos de entrada y salida en estos campos específicos. De hecho, es prescindible, pero en la vida de la gente común, con la cobertura total de la voz en varias escenas, después de un largo período de experiencia, adaptación y cambio en la forma de resolver problemas, la gente se deshará sutilmente de la pantalla y deshazte de la pantalla sin importar la ubicación, puedes recibir información de salida de la manera más directa en cualquier momento y en cualquier lugar, controlar todo en tu vida y finalmente disfrutar de un estado en el que muchos problemas de la vida se pueden resolver hablando.

En tercer lugar, el futuro de la voz

Imagínese además, ¿cómo será la popularización de la voz? Esta será una sociedad interconectada. Últimamente escucho mucho esta palabra que describe el futuro. Entonces, ¿cómo lograr la interconexión? En general, es muy abstracto y aburrido, y resulta un poco sospechoso mantener la voz publicitaria. Luego aprovecharé tu día a día para hablar de este tipo de vida conectada por la voz.

La voz lidera el Internet de todo.

1. Los altavoces inteligentes despiertan a las personas que duermen.

Un día en el futuro, a las seis de la mañana, el altavoz inteligente te despertará mientras aún estás durmiendo. Sólo pregunta sobre el clima de hoy. Después de informar el tiempo, te recuerda que hoy es el solsticio de invierno. No olvides comer bolas de masa.

Después de discutir brevemente qué rellenos son mejores, pídale a la persona que habla que pida un plato de bolas de masa para llevar en un restaurante cercano. Tenga en cuenta que se entregarán en 40 minutos, porque correr es algo que hace todos los días. Cuando salgas, ponte los auriculares inteligentes a juego, despierta al asistente y pídele que reproduzca algunas canciones que normalmente te gusta escuchar. Mientras corría, vi unos gatitos en el parque. No pude evitar mirarlos, pero perdí la noción del tiempo. El auricular me recuerda que la comida para llevar se entregará en 5 minutos. Empezaste a correr a casa, pero ya era demasiado tarde. Me llamó el repartidor, contesté directamente con mis auriculares y le pedí que lo dejara en la puerta. Cuando llegué a casa, me quité los auriculares. Después de lavarme, enciendo el altavoz y dejo que reproduzca las últimas noticias. Escuche y coma bolas de masa. Mi contraseña ha cambiado en varios canales. Si no me interesa lo apago.

2. El asistente de voz del coche te acompaña al trabajo.

Después de cenar, conduce al trabajo. Después de subir al coche, despierta el asistente de voz del coche y déjalo. navegar por la ruta que no esté bloqueada. Después de todo, es la hora punta de la mañana. Justo cuando estaba a punto de comenzar, de repente recordó que las luces de su casa no estaban apagadas, por lo que le pidió a su asistente que apagara rápidamente las luces de su casa y le pidió que verificara si había algo más. Después de confirmar que era correcto, me sentí aliviado. Después de un rato, el asistente del automóvil le recuerda que alguien le envió un mensaje de WeChat. Le dejas leer el contenido. Resulta que tu hermana, que está estudiando en casa, hoy cumple años y tú estabas ocupada con el trabajo y te olvidaste de ello. Pídale al asistente que elija un bolígrafo que cueste unos 200 yuanes. Tras seleccionar el color, el asistente envía la imagen a la pantalla del coche. Me sentí bien, así que pagué con la contraseña y luego le pedí al asistente que le enviara una respuesta a mi hermana: "Te preparé un pequeño obsequio".

3. Los parlantes de la oficina ayudan en el trabajo

Cuando llega el momento de ir a trabajar, despierto a los parlantes de la oficina y les pregunto cuántas tareas tienen que completar hoy. Me temo que seré un vago. Le pides que establezca un tiempo de finalización para todo y luego te lo recuerda. Una de ellas es que necesita enviar correos electrónicos a otras personas al mismo tiempo, para poder pensar directamente en el contenido, informarle a su asistente y permitirle enviarlo a sus colegas, eliminando el engorroso paso de cambiar de interfaz. Mientras trabajaba duro, su jefe de repente le pidió que fuera a un viaje de negocios la próxima semana. Rápidamente le pidió a su asistente que reservara un boleto de avión para el día anterior, reservó un hotel al lado del aeropuerto, simplemente seleccionó el tipo de habitación y. Reservé rápidamente el precio y seguí trabajando. Cuando regresas del almuerzo, tu jefe te llama para una reunión a través de tu asistente. Escuchas y te comunicas al mismo tiempo, lo cual es muy eficiente. El asistente en la sala de conferencias ya transcribió las actas de la reunión y las envió al buzón, por lo que no hay necesidad de preocuparse por perder u olvidar nada.

4. El asistente de voz te ayuda a conciliar el sueño

Vuelve a casa después del trabajo, sal de la empresa, ponte los auriculares, pregunta si te han entregado el bolígrafo que le compraste a tu hermana, y pedirle al asistente que encienda el calentador de agua en casa. Operación y espera se convirtieron en una frase. Conduciendo a casa, la vida de una persona es inevitablemente aburrida, así que solía buscar un asistente para charlar con él un rato. Él lo sabe todo y abrirá algunos nudos en tu trabajo. Después de charlar y sentirse mejor, déjale que eche un vistazo a los platos del frigorífico y te recomiende algunas recetas que pueda prepararte. Elige una sencilla y mírala mientras cocina. Pon las canciones que suele gustar escuchar pensativamente. no te sientas cómodo. Antes de acostarme, le conté las tareas laborales de mañana y luego me fui a dormir. Mañana es un nuevo día.

En cuarto lugar, las futuras aplicaciones de la voz son comunes y están muy extendidas.

La historia es ordinaria, pero este lado ordinario es la forma de vida de la mayoría de las personas, y la pronunciación sólo puede ejercer su gran valor en esta vida ordinaria. (La historia no describe que la entrega urgente se realiza mediante vehículos no tripulados. Los camareros que comen son todos mesas de comedor automáticas o camareros robot. Los limpiadores del pasillo ya son robots de barrido. Los instrumentos automáticos de diagnóstico y tratamiento equipados en la empresa o en la carretera puede comprobar el estado físico en cualquier momento. Principalmente utilizamos la aplicación de voz).

Se puede ver en la historia que, aunque es solo un trabajador de oficina común y corriente, cuando use dispositivos de voz para atenderlo, incluirá, entre otros, la logística, comida para llevar y correo electrónico antes mencionados. comercio, toma de notas, recordatorios, etc. Enviar mensajes, navegar, leer texto, chatear en casa, escuchar música, contestar llamadas, realizar pagos, noticias y muchos otros campos. Siempre decimos que la riqueza de los escenarios de aplicaciones de Internet le da a la inteligencia artificial un mayor margen de desarrollo, pero es precisamente por la riqueza de los escenarios de aplicaciones. Satisfacer las necesidades ordinarias de la vida de las personas no es tan fácil. Una vez que la riqueza de la escena no sea suficiente, el efecto de la experiencia se reducirá. Si el entorno de hardware no puede cubrir la escena y la comodidad de la voz no se puede utilizar por completo, todavía queda mucho por hacer en el camino de la voz.

La importancia del uso de la pronunciación es aumentar la eficiencia, la diversidad y el interés en la resolución de problemas.

No usamos la pronunciación deliberadamente, pero cuando queremos completar algo rápidamente en cualquier momento, naturalmente estamos acostumbrados a decir una oración para resolverlo. Esto requiere que la máquina haga el trabajo preliminar al extremo y construya un ecosistema rico. software y hardware.

5. Problemas que aún deben superarse en las aplicaciones de voz

Hay varios problemas en la historia que aún deben superarse en la tecnología y el diseño de productos:

1. Cómo se conecta y controla una variedad de hardware (auriculares, parlantes, electrodomésticos), el software es interoperable y el contenido se actualiza en tiempo real.

2. Cómo utilizar auriculares y altavoces para lograr un dictado de voz a larga distancia, mientras se diseña la función de borrar y modificar en cualquier momento.

3. ¿Cómo pedir varios billetes y comprar productos?

4. No es un problema para las computadoras utilizar algoritmos para seleccionar productos. ¿Cómo reciben los resultados de la manera más fácil de usar?

5. ¿Cómo enviar mensajes de forma proactiva o proporcionar algunas funciones de forma proactiva a los usuarios en función de sus hábitos de vida durante un período de tiempo, de qué forma y en qué momento?

6. ¿Puede la máquina hacer dos o más cosas en paralelo al mismo tiempo (poner música, hablar de recetas)?

7. Al chatear, no siempre puedes responder desde abajo. Cómo resolver problemas de enciclopedia, problemas profesionales e incluso necesidades emocionales con una actitud neutral y un análisis racional puede no ser sólo una cuestión técnica.

8. Debido a la variedad de escenas, no puedes permanecer despierto todo el tiempo. ¿Cómo recordar a los usuarios fechas, horarios, mensajes nuevos y otra información sin despertarlos?

9. ¿Cómo deshacerse del pago por interfaz manteniendo una alta seguridad?

10. ¿Cómo controlar la cantidad de información, el ritmo, la velocidad y el volumen del habla para que los usuarios no sean rechazados?

11. Cómo diseñar el uso inmediato de texto, salpicaduras de agua y voz, y dar tiempo a los usuarios para confirmar. ¿pista? ¿O repetir la lectura?

Conclusión del verbo intransitivo

Debido a que la audiencia de la voz es toda persona común y corriente, la experiencia del producto es más importante que otras direcciones. Por el contrario, es bueno satisfacer a las personas con precisión técnica, por lo que los requisitos para los diseñadores de interacción y gerentes de producto son mayores.

Con las preguntas anteriores, permítanme resumir y analizar el diseño actual de las aplicaciones, chips y plataformas abiertas de las empresas de IA para ver qué problemas se han resuelto, cuáles aún tienen un largo camino por recorrer y cuáles aún tienen un largo camino por recorrer. cuáles son más importantes. Cuál se centra más en la tecnología y cuál se centra más en el diseño ayudará a la empresa a encontrar un posicionamiento preciso, productos competitivos, dirección de desarrollo e ideas para la resolución de problemas.

Enviar correo electrónico:

¿Este artículo está escrito por Li Jiao? ¿Peso? ¿Por qué? ¿Qué? ¿Prueba de brujas? ¿Qué preguntas tienes? ¿Eres vago? ¿Embarazada? ¿Cuál es el número de plagas? ¿Por qué? ¿Por qué? ¿Por qué? ¿doblar? /p>;