Red de conocimiento de recetas - Se unen a la olla caliente - Cómo crear personajes de usuario

Cómo crear personajes de usuario

Una etiqueta suele ser un identificador de característica altamente refinado especificado artificialmente, como etiqueta de grupo de edad: 25 ~ 35 años, etiqueta de región: Beijing. La etiqueta presenta dos características importantes: semántica y es muy conveniente. para que las personas comprendan el significado de cada etiqueta. Esto también hace que el modelo de retrato de usuario sea práctico. Puede satisfacer mejor las necesidades comerciales. Por ejemplo, determinar las preferencias del usuario. Para textos cortos, cada etiqueta generalmente solo representa un significado y la etiqueta en sí no necesita realizar demasiado trabajo de preprocesamiento, como el análisis de texto, lo que facilita el uso de máquinas para extraer información estandarizada.

Las personas formulan reglas de etiquetas y pueden leer rápidamente la información a través de etiquetas, y las máquinas facilitan la extracción de etiquetas y el análisis de agregación. Por tanto, los retratos de usuarios, es decir, las etiquetas de usuario, nos muestran un método simple y conciso para describir la información del usuario.

3.1 Análisis de la fuente de datos

Construir retratos de usuarios es restaurar la información del usuario, por lo que los datos provienen de: todos los datos relacionados con el usuario.

Para la clasificación de datos relacionados con el usuario, se introduce una idea de clasificación importante: el método de clasificación cerrado. Por ejemplo, hay dos tipos de personas en el mundo, los que aprenden inglés y los que no. Los clientes se dividen en tres categorías, clientes de alto valor, clientes de valor medio y clientes de bajo valor; se divide en período de inversión, período de crecimiento, período de madurez, período de declive... todas las subcategorías constituirán el conjunto completo del espacio de categorías.

Este método de clasificación ayuda a enumerar continuamente y complementar de forma iterativa las dimensiones de información que faltan. No hay necesidad de preocuparse por no considerar completamente cada capa de clasificación en la arquitectura, lo que resultaría en dimensiones faltantes y riesgos de escalabilidad. Además, los diferentes métodos de clasificación pueden tener sus propios motivos según los diferentes escenarios de aplicación y necesidades comerciales, y se pueden dividir según sea necesario.

Este artículo divide los datos del usuario en dos categorías: datos de información estática y datos de información dinámica.

Datos de información estática

La información del usuario relativamente estable, como se muestra en la figura, incluye principalmente datos sobre atributos demográficos, atributos comerciales y otros aspectos. Este tipo de información tiene su propia etiqueta. Si la empresa tiene información real, no es necesario realizar demasiados modelos y predicciones. Se trata más bien de un trabajo de limpieza de datos. Por lo tanto, el modelado de datos de esta información no es el tema central de este artículo.

Datos de información dinámica

Información de comportamiento en constante cambio de los usuarios Si Dios existe, el comportamiento de todos es monitoreado por los ojos invisibles de Dios en todo momento. En términos generales, un usuario abre una página web y. compra una taza; lo mismo que el usuario pasea al perro por la noche, retira dinero una vez durante el día, bosteza, etc., son todos comportamientos del usuario a los ojos de Dios. Cuando los comportamientos se concentran en Internet e incluso en el comercio electrónico, los comportamientos de los usuarios se centrarán en muchas cosas, como se muestra en la imagen de arriba: navegar por la página de inicio de Vanke, navegar por la página de productos de calzado informal, buscar zapatos de lona, ​​publicar en Weibo sobre calidad del calzado y que le guste "Double Ten". Una gran promoción es increíble”, mensaje de Weibo. etc. puede considerarse como un comportamiento de usuario de Internet.

Este artículo toma a los usuarios de comercio electrónico de Internet como principal objeto de análisis y, por el momento, no considera los datos de comportamiento del usuario fuera de línea (los métodos de análisis son los mismos, pero los métodos de adquisición de datos y los métodos de identificación del usuario son algo diferentes).

En Internet, el comportamiento del usuario puede considerarse como la única fuente de datos de información dinámica del usuario. Este artículo se centrará en cómo construir un modelo de datos para los datos de comportamiento del usuario y analizar las etiquetas de los usuarios.

3.2 Análisis de objetivos

El objetivo de los retratos de usuarios es analizar el comportamiento del usuario y finalmente etiquetar a cada usuario y el peso de la etiqueta. Por ejemplo, vino tinto 0,8, Li Ning 0,6.

Las etiquetas representan contenido y los usuarios tienen intereses, preferencias, necesidades, etc. en este contenido.

El peso representa el índice, el índice de interés y preferencia del usuario, y también puede representar la demanda del usuario, que puede entenderse simplemente como credibilidad y probabilidad.

3.3 Método de modelado de datos

El siguiente contenido presentará en detalle cómo construir un modelo para generar etiquetas y pesos según el comportamiento del usuario. Un modelo de evento incluye tres elementos: tiempo, lugar y personas. El comportamiento de cada usuario es esencialmente un evento aleatorio, que se puede describir en detalle como: qué usuario hizo qué, en qué momento y dónde.

Qué usuario: la clave es identificar al usuario. El propósito de la identificación del usuario es distinguir a los usuarios y el posicionamiento de un solo punto.

Lo anterior enumera los principales métodos de identificación de usuarios en Internet, y los métodos para obtenerlos son de fáciles a difíciles. Dependiendo de la fidelidad del usuario de la empresa, la información de identificación que se puede obtener varía.

A qué hora: el tiempo incluye dos información importante: marca de tiempo + duración del tiempo. Marca de tiempo, para identificar el momento del comportamiento del usuario, como 1395121950 (precisión en segundos), 1395121950.083612 (precisión en microsegundos), generalmente es suficiente una marca de tiempo con precisión en segundos. Porque la precisión de la marca de tiempo de microsegundos no es confiable. La precisión del tiempo del navegador solo es exacta en milisegundos como máximo. El período de tiempo se utiliza para identificar cuánto tiempo permanece el usuario en una determinada página.

Dónde: Punto de contacto del usuario, Punto de Contacto. para cada punto de contacto del usuario. Potencialmente contiene dos capas de información: URL + contenido. URL: Cada enlace URL (página/pantalla) ubica la dirección de una página de Internet o una página específica de un producto. Puede ser la URL de la página de un sitio web de comercio electrónico en una PC, o puede ser una página de función de una aplicación como Weibo o WeChat en un teléfono móvil, o una pantalla específica de la aplicación de un producto. Por ejemplo, la página de producto único de vino tinto Great Wall, la página de cuenta de suscripción de WeChat y la página de liquidación de un determinado juego.

Contenido: El contenido de cada url (página/pantalla). Puede ser información relacionada con un solo producto: categoría, marca, descripción, atributos, información del sitio web, etc. Por ejemplo, vino tinto, Gran Muralla, tinto seco, para cada punto de contacto de Internet, la URL determina el peso;

Nota: El punto de contacto puede ser la dirección de un sitio web o una interfaz funcional específica de un producto. Por ejemplo, la misma botella de agua mineral cuesta 1 yuan en el supermercado, 3 yuanes en el tren y 5 yuanes en el lugar panorámico. El valor de venta de un producto no depende de su costo, sino del lugar donde se vende. Todas las etiquetas son agua mineral, pero los diferentes puntos de contacto reflejan la diferencia de peso. El peso aquí puede entenderse como los diferentes niveles de demanda de agua mineral de los usuarios. Es decir, el valor que uno está dispuesto a pagar difiere.

Peso de la etiqueta

Agua mineral 1 // supermercado

Agua mineral 3 // tren

Agua mineral 5 // lugar escénico

p>

Del mismo modo, existe una diferencia en la preferencia por el vino tinto cuando los usuarios buscan información sobre vinos tintos en JD.com y en Pinshang Red Wine. El enfoque aquí es que diferentes URL tienen diferentes pesos y el modelo de peso debe construirse de acuerdo con sus respectivas necesidades comerciales.

Por lo tanto, la URL en sí representa el peso de preferencia de etiqueta del usuario. El contenido correspondiente a la URL refleja la información de la etiqueta.

Qué: Tipo de comportamiento del usuario, para el comercio electrónico, los comportamientos típicos son los siguientes: navegar, agregar carrito de compras, buscar, comentar, comprar, hacer clic en Me gusta, recopilar, etc.

Los diferentes tipos de comportamiento tienen diferentes pesos para la información de la etiqueta generada por el contenido del punto de contacto. Por ejemplo, el peso de la compra es 5 y el peso de la navegación es 1

Vino tinto 1 // Explorar vino tinto

Vino tinto 5 // Comprar vino tinto

Con base en el análisis anterior, el usuario El modelo de datos de elaboración de perfiles se puede resumir en la siguiente fórmula: identificación del usuario + tiempo + tipo de comportamiento + punto de contacto (sitio web + contenido), por qué hora, lugar y qué usuario hizo. Entonces se etiquetará **.

El peso de las etiquetas de usuario puede disminuir con el tiempo, por lo que el tiempo se define como el factor de caída r. El tipo de comportamiento y la URL determinan el peso, y el contenido determina la etiqueta, que luego se convierte en una fórmula. :

Peso de la etiqueta = factor de atenuación × peso del comportamiento × subpeso del sitio web

Por ejemplo: el usuario A buscó información sobre una botella de vino tinto seco Great Wall valorada en 238 yuanes en Pinshang Red Vino ayer.

Etiqueta: vino tinto, Gran Muralla

Hora: debido a que fue el comportamiento de ayer, supongamos que el factor de atenuación es: r=0,95

Tipo de comportamiento: Navegación el comportamiento se registra como peso 1

Ubicación: el subpeso de URL de la página de producto único de vino tinto de Pinshang se registra como 0,9 (en comparación con 0,7 para la página de producto único de vino tinto de JD.com)

Supongamos que al usuario realmente le gusta el vino tinto, irá a sitios web profesionales de vino tinto para comprarlo en lugar de comprar en grandes centros comerciales.

Entonces la etiqueta de preferencia del usuario es: vino tinto, y el peso es 0,95*0,7 * 1=0,665, es decir, usuario A: vino tinto 0,665, Gran Muralla 0,665.

La selección de los valores de peso del modelo anterior es solo un ejemplo. Los valores de peso específicos deben modelarse dos veces de acuerdo con las necesidades comerciales. Lo que se enfatiza aquí es cómo pensar de manera integral para construir un modelo. modelo de retrato del usuario y luego refinarlo gradualmente.