Sistema de etiquetado para retratos de usuarios
Con el auge de Internet, cada día se genera una gran cantidad de contenido en forma de vídeos y se sube a las principales plataformas. Ante cantidades masivas de contenido, cómo mejorar la eficiencia de la distribución inteligente de este contenido es una cuestión importante a la que se enfrentan las principales plataformas.
Para lograr este objetivo, el primer paso es comprender mejor a nuestros usuarios. El proceso de establecer retratos de usuarios es esencialmente el proceso de etiquetar la información del usuario. A través de la construcción del sistema de etiquetas, por un lado, los datos se vuelven legibles, fáciles de entender y convenientes para el uso comercial, por otro lado, las etiquetas se organizan y organizan a través del sistema de categorías de etiquetas para que coincidan con los cambios constantes; escenarios de negocios en el futuro con una necesidad de método de organización más aplicable. Cómo planificar razonablemente el sistema de etiquetado tiene un gran impacto en la operación del producto, por lo que el etiquetado es una parte particularmente crítica de la estrategia del producto.
2. ¿Qué es una etiqueta?
En diferentes escenarios, la definición de etiquetas suele ser diferente. Si está demasiado enredado u obsesionado con la definición de un solo concepto, no podrá promover negocios ni trabajos reales. Todo nuestro trabajo técnico y comercial tiene como objetivo objetivos comerciales y debe ser práctico y aplicable, no puramente académico.
En términos generales, creemos que las etiquetas se refieren a "datos legibles, comprensibles y valiosos que la empresa puede utilizar directamente utilizando datos sin procesar y generando a través de cierta lógica de procesamiento".
Existen Hay dos formas de organizar un sistema de etiquetas: etiquetas estructuradas y etiquetas semiestructuradas/no estructuradas.
Las llamadas etiquetas estructuradas sirven para formular un sistema de etiquetas jerárquico de acuerdo con ciertas clasificaciones. Las etiquetas de nivel superior son los nodos principales de las etiquetas de nivel inferior e incluyen relaciones en la cobertura multitudinaria. Algunos anuncios orientados a la marca suelen utilizar este sistema de etiquetas estructuradas para dirigirse a la audiencia. Cabe señalar que las etiquetas en este sistema se formulan en base a la lógica del lado de la demanda. Algunas etiquetas confidenciales que son de gran importancia para los medios, como las militares, no deberían aparecer en el sistema de etiquetas porque no están claras. exigir correspondencia.
Otra forma de organizar etiquetas de interés es establecer etiquetas basadas en necesidades específicas. No todas las etiquetas se pueden describir en el mismo sistema de clasificación y no existe una relación clara entre padres e hijos. Este sistema de etiquetas semiestructuradas o no estructuradas a menudo contiene un conjunto de etiquetas relativamente precisas, por lo que es principalmente adecuado para una variedad de objetivos, especialmente para la necesidad de una entrega de contenido precisa donde coexisten objetivos de rendimiento.
La decisión de elegir un sistema de etiquetas de interés estructurado o un sistema de etiquetas de interés no estructurado se basa más en escenarios comerciales. Cuando las etiquetas son solo variables intermedias requeridas por el sistema de entrega y se utilizan como entradas variables para la predicción de CTR u otros módulos, entonces un sistema de etiquetado estructurado es realmente innecesario y las etiquetas deben planificarse o extraerse completamente de una manera basada en efectos. no hay necesidad de restricciones de relación jerárquica entre ellos.
También existe una forma especial de etiquetas, las palabras clave. Segmentar a las personas y colocar anuncios directamente en función de las palabras clave utilizadas en las búsquedas o en la navegación por el contenido a menudo puede lograr resultados más precisos. El sistema de etiquetado de palabras clave es jerárquico y completamente desestructurado. Aunque es fácil de entender, no es fácil de operar. Sin embargo, debido a la importante posición de las búsquedas en Internet, se ha desarrollado completamente una tecnología especial para seleccionar y optimizar palabras clave, por lo que esta etiqueta también se usa comúnmente en la práctica.
3. ¿Cómo construir un sistema de etiquetas?
1. Determinar el objeto
Para construir una etiqueta, primero debes saber qué tipo de objeto quieres etiquetar, es decir, determinar el objeto. Objeto es la abstracción del objeto de investigación en el mundo objetivo, incluidos tanto objetos físicos como objetos virtuales. En el proceso de gestión empresarial, hay muchos objetos que se pueden abstraer. Estos objetos están relacionados entre sí en diferentes escenarios comerciales y son activos importantes de la empresa y deben describirse y comprenderse en su totalidad.
Después de resumir la experiencia de muchas industrias y muchos sistemas de etiquetas, los objetos se pueden dividir en tres categorías: personas, objetos y relaciones. Estos tres objetos son diferentes. Las "personas" a menudo tienen iniciativa y sabiduría, pueden participar activamente en actividades sociales, desempeñar activamente un papel promotor y, a menudo, son transmisores de relaciones. Los "objetos" son a menudo pasivos e incluyen materias primas, equipos, edificios, herramientas simples o conjuntos funcionales, y son receptores de relaciones.
Cuando un dispositivo convencional tiene suficiente inteligencia artificial y se convierte en robot, entra en la categoría de "humano". Tanto "personas" como "objetos" son objetos reales, es decir, objetos visibles y tangibles, mientras que "relación" pertenece a un objeto virtual y es la definición de la conexión entre dos entidades físicas. Debido a que las relaciones son tan importantes, las empresas definen, repiten, registran, analizan y optimizan las relaciones en la mayoría de los casos, por lo que el objeto "relación" es necesario para describir y estudiar las relaciones. Según las diferentes motivaciones, las relaciones se pueden dividir en relaciones fácticas y relaciones atribucionales. Las relaciones de hechos pueden producir medidas de hechos cuantificables, y las relaciones de atribución son sólo un atributo de atribución.
Al definir la definición y clasificación de objetos, podemos determinar los objetos para establecer un sistema de etiquetado según las necesidades del negocio. Hay tantos objetos basados en contenido que es imposible establecer un sistema de etiquetado independiente para todos los objetos. Generalmente, clasificaremos según los requisitos de tráfico comercial, la cantidad de manuscritos, la similitud de categorías y las relaciones entre categorías para determinar la prioridad y necesidad de las etiquetas.
2. Marco de diseño
En términos generales, los productos de Internet necesitan utilizar una gran cantidad de categorías de etiquetas. Cuando el número de elementos de etiquetas excede un cierto número, resulta problemático para el personal comercial usar o encontrar etiquetas, y resulta difícil administrar las etiquetas. Por lo tanto, el autor se basa en el método clásico en la gestión de bibliotecas: una gran cantidad de libros requiere un sistema especial de clasificación de libros para numerarlos y organizarlos en archivadores según los números. Al consultar libros, los lectores pueden encontrar rápidamente los libros que necesitan a través del índice numerado, y los bibliotecarios también pueden organizar todos los libros de manera conveniente y efectiva.
Para crear un sistema de categorías de etiquetas, primero debe determinar el directorio raíz. El directorio raíz es el objeto mencionado anteriormente, por lo que hay tres directorios raíz: personas, objetos y relaciones. El directorio raíz, al igual que la raíz, determina directamente qué tipo de árbol es.
Si el directorio raíz es una persona, es decir, este sistema de categorías de etiquetas es un sistema de categorías de etiquetas de una persona. Cada directorio raíz tiene una columna de identificación para identificar de forma única un objeto específico. La categoría de personas incluye dos subraíces: personas naturales y personas jurídicas corporativas. Al mismo tiempo, los grupos de personas físicas o las personas jurídicas jurídicas también pueden considerarse raíces secundarias dentro del ámbito de los objetos humanos. Ejemplos de personas físicas pueden ser consumidores, empleados, franquiciados, etc. , para que se pueda formar un sistema de categorías de etiquetas para consumidores, empleados y franquiciados. Asimismo, las personas jurídicas también pueden subdividirse en empresas físicas, empresas comercializadoras, empresas de transporte, etc. Desde la raíz más grande "persona", hasta las subraíces de "persona física/persona jurídica/grupo de personas físicas/grupo de personas jurídicas", hasta el ejemplo de "usuario/empleado/franquiciado", todos pertenecen a la categoría de directorio raíz.
Del mismo modo, las cosas también se pueden subdividir en subcategorías como elementos, objetos, colecciones de elementos y colecciones de objetos, y las raíces también se pueden subdividir en cada subcategoría. Las relaciones también se pueden subdividir en "registros de relaciones" y "conjuntos de relaciones".
El sistema de clasificación de etiquetas utiliza un sistema de clasificación para diseñar, distribuir y clasificar las etiquetas requeridas por el negocio. El sistema de categorías en sí sirve para clasificar y organizar un determinado tipo de objetivos. La clasificación generalmente utiliza categorías de primer nivel, categorías de segundo nivel y categorías de tercer nivel como nombres de clasificación.
La estructura de categorías se puede comparar con una estructura de árbol. La rama de primer nivel que crece desde la raíz se llama categoría de primer nivel; la segunda rama que crece desde la primera rama se llama segunda categoría; La tercera rama que surge de las dos ramas se llama rama terciaria. La estructura general de categorías se puede configurar como una jerarquía de tres niveles. Una categoría sin una categoría siguiente se denomina categoría de hoja, y la hoja específica que cuelga de la categoría de hoja es la etiqueta.
Cabe señalar que la construcción de marcos de categorías generalmente se basa en negocios, porque el significado central del sistema de categorías es ayudar a los usuarios a encontrar y administrar rápidamente datos/etiquetas.
La siguiente figura es un sistema de categorías de etiquetas de clientes construido por un banco. El cliente es el directorio raíz, que se identificará de forma única mediante custom_id. En el directorio raíz, hay características básicas, características de activos y características de comportamiento. , características de preferencia, características de valor y categorías de primer nivel, como características y características de marketing. El primer tipo de características básicas se divide en dos categorías: información de tarjeta de identificación, información demográfica, información de dirección e información de ocupación. El segundo tipo de información de dirección se subdivide en tres categorías: dirección de facturación, dirección particular, dirección del trabajo y dirección de teléfono móvil. En la categoría de tercer nivel, "Dirección de facturación", hay etiquetas como "Dirección de facturación detallada", "Código postal de la dirección de facturación" y "Provincia de dirección de facturación".
Una vez completado el diseño de la categoría de etiquetas, el marco de todo el sistema de etiquetas está listo. Lo siguiente que hay que hacer es llenar cada categoría de hojas con etiquetas que tengan valor comercial y puedan procesarse, y luego completar el diseño de todo el sistema de etiquetas.
Complete el contenido
A través del diseño de categorías de etiquetas, ya existe un marco de sistema de etiquetas para un determinado objeto, pero no hay un contenido de etiqueta específico. El diseño de etiquetas consiste en diseñar una etiqueta adecuada y adjuntarla a la categoría de etiqueta. En esta parte, el autor intentará romper con la perspectiva técnica y analizar cómo "hacer etiquetas" desde la perspectiva del producto.
Primero, cómo desmontar el contenido. Primero, el contenido se divide en tres partes: usuario, contenido y relación, que sirven como directorio raíz. A continuación, en cuanto a la parte de “personas”, podemos dividirla en: atributos demográficos, atributos de interés, preferencias de comportamiento, tiempo de publicación, etc. Del mismo modo, en cuanto al contenido, podemos dividirlo en "categoría estadística", "categoría de calidad" y "categoría vectorial". Luego, dividimos las categorías secundarias. Por ejemplo, las categorías estadísticas incluyen tasa de clics, duración, tasa de finalización de transmisión, reseñas positivas y tasa de rebote.
Lo que necesita especial atención es que la acción habitual de etiquetar y etiquetar a otros no es en realidad diseñar etiquetas, sino diseñar valores característicos. Por ejemplo, la definición de alguien es "mujer, entre 20 y 30 años, trabajadora de cuello blanco, vivaz y alegre". Estos son los valores característicos específicos de género, edad, ocupación y etiquetas de personalidad.
Estas características se cruzarán hasta cierto punto, dándole más significado a la característica. Por ejemplo, al cruzar retratos de usuarios con retratos de contenido, podemos obtener la coincidencia de intereses a corto y largo plazo de los usuarios, la coincidencia de generalización de intereses conversacionales, las preferencias de edad de los usuarios para ciertas categorías de contenido, las preferencias de género de los usuarios para ciertas categorías de contenido y pronto. Si cruza las características del usuario con el contexto de la solicitud, obtendrá dónde vive el usuario y cómo cambian sus intereses con el tiempo. Por ejemplo, algunos usuarios leerán noticias por la mañana y alguna información de entretenimiento por la noche. También hay algunos escenarios, como usuarios a los que les gusta ver vídeos en el metro, pero les gusta leer imágenes y textos mientras trabajan. Mediante la combinación de estos valores de características, los grupos de usuarios se dividen de la manera más eficiente posible, logrando así una distribución precisa del contenido.
Ahora sabemos cómo construir un sistema de etiquetas y cómo dividir grupos de usuarios a través del sistema de etiquetas, pero para hacer un buen trabajo en el etiquetado, no solo debemos deconstruir la tecnología desde la perspectiva de la demanda, sino también. También debe basarse en "buen contenido". En esta parte, el autor analizará brevemente cómo hacer "buenas etiquetas" mediante la operación desde la perspectiva del creador;
Si desea crear una etiqueta que pueda impresionar a las personas, primero debe comprender a los usuarios y abordar sus puntos débiles.
¿Cómo podemos entender a los usuarios? Una forma es cambiar de rol, ponerse en el lugar de otra persona, considerarse un usuario, ser un "usuario novato" que no entiende nada y mirar y pensar en los problemas desde esta perspectiva.
Por ejemplo, como propietario de un UP, recibió una orden de marketing para promocionar "auriculares con cancelación de ruido". Su tarea es lograr que los usuarios realicen pedidos y completen la conversión de valor del contenido. Piénselo, ¿cómo debería diseñarse esta historia?
La siguiente es una copia de referencia: Usted es gerente de un banco. Es muy difícil mantener relaciones con los clientes y no puede mantener su puesto. Tiene una hipoteca y un préstamo para el automóvil, y el pago mensual es de 5.000 yuanes. Las calificaciones de matemáticas de su hijo no son buenas. Su esposa trabaja como enfermera en el Hospital Popular Municipal. Su madre tiene uremia y ha estado en diálisis durante muchos años. Ella no te ama. Cuando eras joven pensabas que podrías lograr una gran carrera, pero aquí lo tienes, todos tus amigos se llevan mejor que tú. La vida es tan mala que necesitas un entorno separado para expresar tus emociones. En este momento, te pones unos auriculares con cancelación de ruido.
Esta es una típica "perspectiva de usuario", que describe una escena. Te brinda una fuerte sensación de inmersión mientras miras, te infectas involuntariamente por el contenido y provocas fluctuaciones emocionales. Impulsados por las emociones, los pedidos se pueden completar y lograr la conversión de valor.
Además de los métodos de anotación anteriores basados en la experiencia del contenido, existe otro método, que es el "valor de característica" que mencionamos antes. Las etiquetas de contenido de alta precisión generadas en base a algoritmos generalmente se basan en fotogramas de video, títulos, autores, atributos de contenido, atributos geográficos, tiempo, etc. Estas etiquetas de contenido generadas por el algoritmo pueden reemplazar la anotación manual, ahorrando así costos de mano de obra y mejorando la eficiencia de producción de las etiquetas de contenido. En la actualidad, la tasa de precisión de la tecnología de etiquetado de contenido ha alcanzado más del 90% y algunos valores de etiqueta se generan automáticamente mediante el análisis algorítmico del contenido.
Por ejemplo, en el vídeo anterior, los valores de etiqueta generados pueden ser perros rurales de China, áreas rurales, millones de transmisiones, perros, hermanos Huanong, lindas mascotas y animales.
Después de varios pasos, como la determinación del objeto, el diseño del marco, el diseño de categorías, el diseño de etiquetas y la anotación, completamos la construcción de todo el sistema de etiquetas. El artículo es relativamente sencillo y debería servir como guía.
Cuarto, algunos problemas
En el proceso de implementación del sistema de etiquetas, encontraremos muchos problemas. Los siguientes problemas también son en los que el autor ha estado pensando. Si tiene alguna buena sugerencia, agregue al autor para comunicarse en WeChat: shmusk
Puntualidad del contenido: cualquier contenido, incluidos videos o gráficos, tiene un ciclo de vida y el contenido puede ser largo o corto. Es muy difícil predecir el ciclo de vida de un contenido, ya sea mediante algoritmos u otras tecnologías; suponiendo que ya conocemos el ciclo de vida del contenido, cómo exponer efectivamente el contenido dentro del ciclo efectivo también es un problema difícil. Cómo equilibrar estos dos problemas, la puntualidad es muy importante, porque no tiene sentido recomendar contenido a los usuarios después de su ciclo de vida y la experiencia del usuario será mala.
Determinación de la calidad del contenido: Cómo determinar la calidad de un contenido, cuáles son los buenos estándares, cómo modelarlo, si se puede modelar, cuáles son las características y cómo utilizar las características de manera efectiva. para determinar nuestro modelo?
Problema de arranque en frío: dividido en arranque en frío de contenido y arranque en frío del usuario. El inicio en frío del contenido se refiere a un nuevo contenido que ingresa a la plataforma sin distribución por parte del usuario; el inicio en frío se refiere a nuevos usuarios, y los datos de interacción y el comportamiento son muy escasos. ¿Cómo hacer mejores recomendaciones, guiar interacciones posteriores más intensivas, aumentar la adherencia y mejorar así la experiencia del usuario y satisfacer mejor sus necesidades?