Red de conocimiento de recetas - Recetas gastronómicas - Enseñanza integral de cómo establecer un marco de pensamiento para el análisis de datos.

Enseñanza integral de cómo establecer un marco de pensamiento para el análisis de datos.

Enseñarte de manera integral cómo establecer un marco de pensamiento para el análisis de datos

Actualmente, todavía hay algunas personas que no saben cómo establecer un marco de pensamiento para el análisis de datos, por eso hoy tomaré esta clase para enseñarte. cómo establecerlo paso a paso. Si pasa un gran maestro, por favor desvíese y por supuesto comuníquese. Los amigos necesitados pueden consultarlo.

Alguien me preguntó una vez ¿qué es el pensamiento del análisis de datos? Si el pensamiento analítico es una manifestación de estructura, entonces el pensamiento de análisis de datos le añade otro criterio:

No es que yo lo piense, pero los datos lo prueban.

Este es un momento decisivo. "Creo" es una forma de pensar intuitiva y empírica, que no puede utilizarse como base para el trabajo y mucho menos para el desarrollo de una empresa. La prueba de datos es la manifestación más directa del análisis de datos, y el análisis de datos se basa en el pensamiento basado en datos en lugar de habilidades. El primero es una guía y el segundo es solo una aplicación.

Como individuo, ¿cómo debemos establecer el pensamiento de análisis de datos?

1. Establece tu propio sistema de indicadores

Antes de hablar de indicadores, retrocede unas décadas. Peter Drucker, el padre de la gestión moderna, decía un dicho muy clásico:

Si no puedes medirlo, entonces no puedes desarrollarlo de manera efectiva.

Por medición me refiero a la necesidad de un estándar unificado para definir y evaluar el negocio. Esta norma es la medida. Supongamos que Lao Wang abre una frutería al lado. Si le pregunta cómo es su negocio diario, puede responder que las ventas son muy buenas, muy buenas, pero que últimamente han sido lentas. Todo esto son mentiras, porque lo que él cree que es un buen vendedor puede que solo venda 50 unidades, pero lo que usted cree que es un buen vendedor puede que sean 100 unidades.

Esta es la trampa cognitiva provocada por el “yo pienso”. Cuando presentas este caso a la empresa, te encontrarás con más problemas: si un operador te dice que el producto funciona bien porque mucha gente lo comenta y le gusta todos los días, y además te muestra algunas capturas de pantalla. Otro operador dijo que el producto tenía algunos problemas y que los productos promocionados no se vendían bien. ¿A quién debería creerle?

De hecho, es difícil para cualquiera creer que estos juicios que son difíciles de conciliar se deben todos a una falta de pensamiento de análisis de datos.

Si Lao Wang quiere describir una empresa, debería utilizar el volumen de ventas, que es su indicador. Si Internet quiere describir productos, también debería utilizar indicadores como la tasa de actividad, la tasa de uso y la conversión. tasa.

Si no puedes describir tu negocio utilizando métricas, no podrás hacer crecer tu negocio de manera efectiva.

Comprender y utilizar indicadores es el primer paso en el pensamiento de análisis de datos. A continuación, es necesario establecer un sistema de indicadores. Los indicadores aislados no pueden resaltar el valor de los datos. Al igual que el pensamiento analítico, la medición puede y debe estructurarse.

Veamos los productos de Internet. Un usuario seguirá estos pasos desde el principio hasta el final. Esto es cierto para las aplicaciones de comercio electrónico o las plataformas de contenido. Piénselo, ¿qué indicadores necesita utilizar?

La siguiente imagen explica qué es la medición. Esta es la diferencia entre pensar con análisis de datos y pensar sin análisis de datos. También es una operación típica basada en datos. Puede tener la oportunidad de comprender este aspecto en. profundidad.

El sistema estándar no tiene una plantilla única para todos, y diferentes formas comerciales tienen diferentes sistemas de indicadores. Las aplicaciones móviles son diferentes de los sitios web, SaaS es diferente del comercio electrónico y el consumo de baja frecuencia es diferente del consumo de alta frecuencia. Por ejemplo, las aplicaciones relacionadas con bodas no necesitan considerar indicadores de tasa de recompra; las finanzas en Internet deben tener indicadores de control de riesgos en el comercio electrónico, los vendedores y los compradores tienen indicadores diferentes;

Estos requieren diferentes experiencias en la industria y conocimientos comerciales para aprenderlos y dominarlos. Entonces, ¿existen habilidades y precauciones generales?

2. Aclarar los buenos indicadores y los malos indicadores.

No todos los indicadores son buenos indicadores. Este es un error común que cometen los principiantes. Sigamos volviendo a la frutería de Lao Wang y pensemos si el indicador de ventas es bueno o no.

La respuesta de Lao Wang al reciente aumento de precios es aumentar el precio de las frutas, y si no se atreve a aumentarlo, no lo aumentará. Aunque no hay grandes cambios en las ventas de frutas, Lao. Wang descubrió que no ganaba mucho dinero en un mes. No hay suficiente dinero para ahorrar.

Las ventas de varias frutas de Lao Wang este mes alcanzaron las 2.000 piezas, pero al final aún perdió dinero. Un estudio cuidadoso encontró que aunque el volumen de ventas era alto, el inventario de frutas también lo era, con cientos de unidades. piezas de fruta cada mes. Los productos que se venden lentamente eventualmente caducan y pierden dinero.

Los dos ejemplos anteriores ilustran lo poco confiable que es mirar solo las ventas.

Las ventas son una métrica, pero no buena. Los hogares industriales y comerciales individuales como Lao Wang deberían considerar la rentabilidad de las fruterías como un factor fundamental.

Las buenas métricas deben ser métricas impulsadas por el núcleo. Las métricas son importantes, pero algunas métricas deben ser más importantes. Al igual que las ventas y las ganancias, el número de usuarios y el número de usuarios activos, este último es más importante que el primero.

Los indicadores principales no son solo números escritos en el informe semanal, sino objetivos que todo el equipo de operaciones, el equipo de producto e incluso el equipo de I+D trabajan juntos para lograr.

Los indicadores impulsores básicos están estrechamente relacionados con el desarrollo de la empresa y son las direcciones clave de la empresa en una etapa determinada. Recuerde, esta es una etapa y los indicadores básicos de conducción son diferentes en diferentes períodos. Diferentes empresas tienen diferentes indicadores impulsores básicos.

Los indicadores básicos comunes para las empresas de Internet son el número de usuarios y la tasa de actividad. El número de usuarios representa la capacidad y la participación del mercado, y la tasa de actividad representa la salud del producto, pero estos son indicadores básicos. la etapa de desarrollo. En la etapa del producto 1.0, debemos centrarnos en pulir el producto y mejorar su calidad antes de la promoción a gran escala. En este momento, la tasa de retención es un indicador central. En la etapa posterior de un producto con una determinada base de usuarios, la comercialización es más importante que la actividad. Debemos prestar atención a los indicadores relacionados con el dinero, como las tasas de clics publicitarios, los márgenes de beneficio, etc.

Los indicadores principales son generalmente los objetivos generales de la empresa. Si observa las responsabilidades laborales individuales, también puede encontrar sus propios indicadores básicos. Por ejemplo, las operaciones de contenido pueden centrarse en la cantidad de lectores y el tiempo de lectura.

Los indicadores impulsores centrales deben brindar las mayores ventajas y beneficios a la empresa y a las personas. Recuerde la regla 80/20, el 20% de los indicadores deben generar el 80% del efecto. centro.

Por otro lado, otra característica de un buen indicador es que debe ser un ratio o ratio.

Usando el número de usuarios activos para ilustrar nuestra comprensión, tenemos 100.000 usuarios activos. ¿Qué significa esto? No explica nada. Si el producto en sí tiene 10 millones de usuarios registrados, entonces 100.000 usuarios significa que no es saludable y que el producto está decayendo. Si el producto sólo tiene 400.000 o 500.000 usuarios, eso significa que el producto es muy pegajoso.

Debido a que el número de usuarios activos por sí solo no puede explicar nada, las operaciones y los productos prestarán más atención a la tasa de actividad. Esta métrica es la proporción de usuarios activos dividida por el total de usuarios. Por lo tanto, al establecer un indicador, todos intentamos considerar si puede convertirse en una proporción.

Comprender y ver las cosas

Estas preguntas comunes incluyen: ¿Cómo se evalúa una persona famosa o un evento histórico? ¿Qué opinas de un producto? ¿Cómo te sientes acerca de ciertas cosas? ¿Cómo ve o analiza un determinado comportamiento o punto crítico, etc.?

Para pensar en mirar o analizar cosas, su lógica es mucho de lo que hemos pensado antes, es decir, la cosa en sí debe analizarse integralmente en combinación con el entorno externo + la línea de tiempo + el dimensiones centrales de la cosa, como el entorno externo de la cosa, las relaciones interactivas, la estructura interna y la conexión de las cosas, las características de comportamiento mostradas dinámicamente de las cosas mismas, etc. Primero hay que analizar con claridad éstas, es decir, las características de comportamiento de la cosa misma. Estas primero deben ser analizadas con claridad, es decir, debemos tener una comprensión integral y objetiva de las cosas mismas.

El núcleo de este tipo de pensamiento es un tipo de pensamiento dialéctico. No me gusta usar la palabra pensamiento especulativo. El pensamiento dialéctico puede reflejar mejor el enfoque de este tipo de pensamiento, que es integral y objetivo. Utiliza datos para hablar mientras reduce el sesgo subjetivo. No es necesario expresar sus propios sentimientos subjetivos sobre estos temas. Lo que es más importante es explicar los hechos y la verdad con claridad y poder estar bien fundamentados.

Después del análisis real, tenemos que pasar a la evolución de este tipo de problema, es decir, cómo valorar o evaluar una cosa. El requisito previo es analizar datos objetivos, pero los datos en sí no. un indicador de evaluación o valoración, por lo que cuando se trata de valoración, naturalmente pensamos en la necesidad de establecer o hacer referencia a un sistema de evaluación. Los emperadores en la historia tienen varios sistemas de evaluación, como la política, la economía, la diplomacia, el ejército y el sustento del pueblo. Un automóvil puede tener varios sistemas de evaluación de potencia, confort, consumo de combustible, manejo, etc. Para el producto en sí, también existen varios sistemas de evaluación, como realización de funciones, facilidad de uso, rendimiento, precio, etc. Para cualquier evaluación, primero debemos encontrar un sistema de evaluación científica ya preparado y luego asignar los datos analíticos a un sistema de evaluación específico. Es decir, el valor de cualquier indicador de evaluación debe estar respaldado por los datos intrínsecos y el mecanismo operativo de la cosa. sí mismo.

Después de pensar claramente en estas cosas, este tipo de pensamiento se enfoca en analizar la descomposición e integración de las cosas, analizar el comportamiento o actividades de las cosas, analizar la relación entre las cosas y el entorno interno y externo, y analizar los atributos clave y los sistemas de evaluación de las cosas mismas determinar las dimensiones, analizar las características de los indicadores clave de las cosas, analizar la fuerza impulsora de las restricciones (similar a los ciclos hacia adelante y hacia atrás del pensamiento sistémico), etc.

¿Qué son los malos indicadores?

En primer lugar, es un indicador nulo sin significado práctico.

¿Tiene sentido que un producto tenga cientos de miles de exposiciones en la tienda de aplicaciones? Lo que necesito es el número real de descargas. ¿Tiene sentido la descarga? No, quiero que los usuarios se registren. Tanto la exposición como las descargas son indicadores de vanidad, pero el grado de vanidad es diferente.

Todos los nuevos medios persiguen el volumen de lectura de las cuentas oficiales de WeChat. Si confía en el volumen de lectura para hacer publicidad, entonces el volumen de lectura es significativo. Si confía en imágenes y texto para vender productos, entonces debe pagar. más atención a las tasas de conversión y las ventas, después de todo, un título exagerado puede generar un alto volumen de lectura. En este momento, el volumen de lectura es un indicador de vanidad. Desafortunadamente, muchos jefes todavía persiguen incansablemente 10W+, incluso si se esfuerzan demasiado.

Los indicadores de vanidad son indicadores sin sentido. Muchas veces lucen bien y pueden disfrazar las operaciones y el desempeño del producto, pero debemos evitar su uso.

El segundo mal indicador es el indicador posterior, que muchas veces sólo refleja lo que ya ha sucedido.

Por ejemplo, tengo una definición de tasa de abandono: si no abres la aplicación durante tres meses, se te considera un abandono. Luego, el número de usuarios perdidos contabilizados por la operación todos los días no se ha abierto durante mucho tiempo. En términos de puntualidad, ha sucedido durante mucho tiempo y es difícil recuperarse mediante medidas. Sé que una vez que la operación no es buena, significa dañar al usuario, pero ¿sigue siendo útil?

El ROI (retorno de la inversión) de las operaciones de eventos también es un indicador a posteriori. Sólo después de que una actividad ha pagado un costo se pueden conocer sus beneficios. Pero el costo ya se ha gastado y la calidad de la actividad está determinada. Si el evento dura más, hay margen de ajuste. Para campañas a corto plazo, esta métrica solo se puede utilizar para revisión, pero no para impulsar el negocio.

La tercera métrica mala es la métrica de complejidad, que atrapa el análisis de datos en un montón de métricas.

Los indicadores se pueden subdividir. Por ejemplo, la tasa de actividad se puede subdividir en tasa de actividad diaria, tasa de actividad semanal, tasa de actividad mensual, tasa de actividad del usuario anterior, etc. El análisis de datos debe seleccionar indicadores en función de circunstancias específicas. Si es una herramienta meteorológica, puede elegir la tasa de actividad diaria. Si es una aplicación social, puede elegir la tasa de actividad semanal. Para productos más frecuentes, puede elegir la tasa de actividad mensual. tasa de actividad.

Cada producto tiene varios indicadores que son adecuados para él. No tenga un montón de indicadores en mente. Cuando prepare veinte o treinta indicadores para el análisis, encontrará que no tiene forma de comenzar. .

3. Establecer una estructura de indicadores correcta

Dado que no es bueno tener demasiados y demasiados indicadores, ¿cómo debemos elegir los indicadores correctamente?

Al igual que la estructura piramidal del pensamiento analítico, los indicadores también tienen su propia estructura interna, mostrando forma de árbol. El núcleo de la construcción de una estructura de indicadores es pensar en el problema desde la perspectiva de los procesos de negocio y orientarse por la estructura.

Supongamos que es un operador de contenidos y necesita analizar el negocio existente para mejorar los datos relacionados con el contenido. ¿Qué haría?

Transformemos el pensamiento piramidal en un enfoque de análisis de datos.

Comience desde el proceso de operación del contenido, a saber: recopilación de contenido - edición y publicación de contenido - navegación del usuario - clics del usuario - lectura del usuario - comentarios o reenvío del usuario - continúe con el siguiente paso de navegación.

Este es un proceso estándar y se pueden crear indicadores para cada proceso. La recopilación de contenido crea un índice de popularidad para ver qué contenidos son más populares. La navegación del usuario y los clics del usuario son estadísticas estándar de PV y UV, mientras que la lectura del usuario es el tiempo de lectura.

Construir un marco de métricas desde una perspectiva de proceso le permite cubrir de manera integral datos relevantes para el usuario sin perder nada.

Los indicadores enumerados en este marco siguen el principio del indicador: se requieren indicadores impulsores básicos. Elimine los indicadores vacíos, elimínelos adecuadamente y agregue indicadores sin agregar indicadores.

4. Comprender el análisis dimensional

Con los indicadores, puede iniciar el análisis de datos y se puede dividir en tres categorías:

Usar dimensiones para analizar datos

p>

p>

Utilice conocimientos estadísticos, como pruebas de hipótesis de distribución de datos

Utilice el aprendizaje automático

Primero comprendamos el análisis dimensional.

Las dimensiones son parámetros que describen objetos. En un análisis específico, podemos considerarlas como el ángulo desde el cual analizar las cosas. Las ventas son un ángulo, la tasa de actividad es un ángulo y el tiempo es un ángulo, por lo que todos cuentan como dimensiones.

Una vez que tenemos las dimensiones, podemos formar un modelo de datos combinando diferentes dimensiones. El modelo de datos no es un concepto esotérico, es simplemente un cubo de datos.

La imagen de arriba es un modelo de datos/cubo de datos compuesto de tres dimensiones. Son tipo de producto, tiempo y región. No sólo podemos obtener las ventas de productos electrónicos en Shanghai en el segundo trimestre de 2010, sino también las ventas de libros en Jiangsu en el primer trimestre de 2010.

Los modelos de datos organizan datos complejos de forma estructurada y ordenada. Las métricas de las que hablamos anteriormente se pueden utilizar como dimensiones. A continuación se muestra un ejemplo:

Combinando las tres dimensiones de tipo de usuario, actividad y tiempo para comprender cómo los diferentes grupos de usuarios utilizan el producto... ¿El grupo A utiliza el producto durante más tiempo?

Combinando las tres dimensiones de tipo de producto, monto del pedido y región, observe si existen diferencias en las ventas de diferentes productos en diferentes regiones.

A través de los modelos de datos, puede ver datos desde diferentes ángulos y dimensiones, aumentando así la flexibilidad del análisis y satisfaciendo diferentes necesidades de análisis. Este proceso se denomina OLAP (Procesamiento analítico en línea). Este proceso se llama OLAP (Procesamiento analítico en línea). Por supuesto, esto implica cuestiones más complejas, como el modelado y el almacenamiento de datos, que no necesitamos comprender en detalle.

Existen otras técnicas comunes para el modelado de datos, llamadas desglose, resumen y división.

La elección es seguir subdividiendo dimensiones. Por ejemplo, la provincia de Zhejiang se subdivide en la ciudad de Hangzhou, la ciudad de Wenzhou, la ciudad de Ningbo, etc., y el primer trimestre de 2010 se subdivide en enero, febrero y marzo. La acumulación es el concepto opuesto al desglose. Dimensiones como Zhejiang, Shanghai y Jiangsu se resumen en la dimensión Zhejiang-Shanghai. La división consiste en seleccionar dimensiones específicas, como seleccionar solo la dimensión de Shanghai o seleccionar solo la dimensión del primer trimestre de 2010. Debido a que el cubo de datos es multidimensional, solo podemos observar y comparar datos en dos dimensiones, es decir, tablas.

La estructura de árbol en la figura anterior representa la profundización (un desglose de FUENTE y TIEMPO) y luego la obtención de datos específicos mediante el corte AIR de la Ruta.

Si es inteligente, es posible que haya pensado que la tabla dinámica de uso común es una especie de análisis dimensional, que requiere combinar las dimensiones analizadas en filas y columnas para cálculos como sumar, contar y promediar. A continuación se muestra una imagen de un caso que se ha utilizado antes: utilizar la dimensión de la ciudad y la dimensión de años de trabajo para calcular el salario promedio.

Además de Excel, BI, R y Python se pueden utilizar para analizar métodos dimensionales. BI es relativamente simple.

Hablando del método dimensional, me gustaría enfatizar una de las ideas centrales del análisis: comparación y contraste de diferentes dimensiones. Este puede ser uno de los mejores atajos para que los recién llegados mejoren rápidamente. Por ejemplo, la comparación de tendencias pasadas y presentes, la comparación de diferentes dimensiones regionales, la comparación de diferencias en diferentes tipos de productos y la comparación de diferentes grupos de usuarios. Los datos individuales no tienen importancia analítica. Sólo la combinación de múltiples datos puede maximizar el valor de los datos.

Quiero analizar el beneficio de la empresa, beneficio = ventas – coste. Luego conozca los indicadores/dimensiones involucradas en las ventas, como tipo de producto, región, grupo de usuarios, etc., y mediante combinación y desmontaje continuo, descubra las razones de los problemas o las razones del buen desempeño. También cuesta.

Este es el pensamiento correcto de análisis de datos. En resumen: creamos y filtramos indicadores a través del negocio, utilizamos indicadores como dimensiones y utilizamos dimensiones para el análisis.

Mucha gente se preguntará ¿cuál es la diferencia entre indicadores y dimensiones?

La dimensión es el ángulo desde el que explicar y observar las cosas, y la medida es la medida de los datos. Las dimensiones son más grandes que los datos, como las dimensiones de tiempo y las dimensiones de la ciudad. No podemos usar indicadores para representarlas, pero los indicadores (tasa de retención, tasa de rebote, tiempo de navegación, etc.) pueden ser dimensiones. El entendimiento habitual es: Dimensión > Indicador.

En este punto, tienes un marco de pensamiento para el análisis de datos.

Se llama marco porque todos todavía carecen de algunas habilidades específicas, como cómo verificar que una determinada dimensión es la clave para afectar los datos, como cómo utilizar el aprendizaje automático para mejorar los negocios, lo que implica conocimiento de datos y estadísticas, lo que Se discutirá más adelante. Hay explicaciones.

Aquí quiero enfatizar que el análisis de datos no es el resultado, es solo el proceso. ¿Recuerda el dicho "Si no puedes medirlo, no puedes cultivarlo de manera efectiva"? El objetivo final del análisis de datos es el crecimiento empresarial. Si el análisis de datos requiere métricas de desempeño, entonces la cuestión no debe ser si el análisis es correcto o incorrecto, sino el resultado final de mejorar los datos.

El análisis de datos requiere retroalimentación. Cuando analizo un elemento que afecta los resultados del negocio, entonces lo verifico. Informe al personal de operaciones y productos y vea cómo funcionan los datos mejorados; todo se reduce a los resultados. Si los resultados no mejoran, entonces será necesario repensar el proceso de análisis.

Este también es un elemento del análisis de datos, que está orientado a resultados. Si el análisis es sólo un informe sin medidas de seguimiento y mejora, entonces el análisis de datos es cero.

Los negocios guían los datos y los datos impulsan los negocios. Esta es la única manera.

La orientación empresarial se digitaliza y los datos impulsan el negocio.