Red de conocimiento de recetas - Se unen a la olla caliente - ¿Cómo entender la diferencia entre datos tradicionales y big data?

¿Cómo entender la diferencia entre datos tradicionales y big data?

En vista de las oportunidades y desafíos que trae big data a la educación, discutiremos y compartiremos con los lectores las diferencias entre big data y datos tradicionales y el progreso de su implementación en la industria.

Primero, la diferencia entre big data y datos tradicionales

Como todo lo nuevo, big data es un concepto que aún no está claramente definido. Demasiado jóvenes, las universidades más de moda aún no han tenido tiempo de ofrecer esta especialidad y los expertos más de moda aún no han unificado la teoría. Todos los que lo estudian todavía se lamentan de lo diferentes que son los big data de los datos tradicionales.

Internet es una red mágica, y el desarrollo del big data también es un modelo. Si realmente quieres aprender sobre big data, puedes venir aquí. El número inicial de este teléfono móvil es 187, el número del medio es tres cero y el último número es 14250. Puedes encontrarlos combinándolos en orden. Lo que quiero decir es que, a menos que quieras hacerlo o entiendas este aspecto, si simplemente te unes a la diversión, entonces no vengas.

Ingrese big data en Google Scholar para buscar trabajos académicos de los últimos cinco años, hasta 355.000 artículos. Pero si ingresa las palabras clave "grandes datos" y "educación", aparecerán alrededor de 17,600 resultados en la concordancia aproximada y menos de 10 resultados en la concordancia exacta. Se puede ver que la minería de big data en el campo de la educación es todavía una tierra virgen inexplorada y nadie ha establecido las reglas todavía. En el campo de datos tradicional, un examen PISA puede producir más de 300 tesis doctorales en todo el mundo. Cada año se forman en todo el mundo unos 5.000 estudiantes de máster y doctorado en los campos de la educación y la psicometría. Hay hasta 489 revistas básicas del SSCI relacionadas con la educación y el análisis estadístico psicológico. Hay más de 160 instituciones profesionales que brindan análisis de datos para instituciones con más de 4000 empleados, como IES y ETS. Los estándares de la industria como WWC han formado una tradición.

La cantidad de datos y métodos de análisis conducirá inevitablemente al intercambio de armas por armas. En los datos tradicionales, los datos cuantitativos generados para el análisis por un estudiante que ha completado nueve años de educación obligatoria básicamente no excederán los 10 kb, incluida información personal y familiar básica, información relacionada con la escuela y los maestros, y datos fisiológicos como puntajes de exámenes en varios materias, registros de uso de bibliotecas y gimnasios, información médica y de seguros, y otros tipos de datos de evaluación. Con una cantidad de datos tan grande, una computadora doméstica común con alta configuración y software EXCEL o SPSS básico puede realizar análisis estadísticos sobre el número de estudiantes por debajo de 5000, un procesador de doble núcleo, ACESS, SurveyCraft y otras configuraciones de software son suficientes para completar; todo el proceso. Operaciones estadísticas avanzadas por áreas. Este tipo de trabajo generalmente requiere solo educación intermedia y conocimiento de estadística psicológica, un conjunto de plantillas de análisis de datos para el procesamiento de control paso a paso y dos o tres meses de capacitación operativa.

El análisis de big data es un nivel de tecnología completamente diferente. Según una investigación de Classroom Observer, un conocido desarrollador estadounidense de aplicaciones de observación de aulas, los datos holográficos generados por un estudiante en una clase ordinaria de escuela secundaria de 40 minutos son de aproximadamente 5 a 6 GB, y los datos cuantitativos que se pueden clasificar, etiquetar , y analizado es alrededor de 50-60 MB, lo que equivale a la cantidad total de datos que ha acumulado en el campo de datos tradicional durante 5000 años. El procesamiento de estos datos requiere el uso de tecnología de computación en la nube y se requiere software como Matlab, Mathematica y Maple para procesar y visualizar los datos. Los profesionales que pueden manejar estos datos generalmente provienen de los campos de las matemáticas o la ingeniería informática, lo que requiere una gran experiencia y capacitación. Lo que es aún más valioso es que no existe un método determinado para la extracción de big data y depende más del talento y la inspiración del minero.

La diferencia esencial entre big data y datos tradicionales radica en la fuente de recopilación y la dirección de la aplicación. Los métodos tradicionales de recopilación de datos pueden resaltar mejor el nivel académico general de los estudiantes, el desarrollo físico y la condición física, el desarrollo socioemocional y adaptativo, la satisfacción con la escuela, etc. Es imposible e innecesario recopilar estos datos en tiempo real, pero se obtienen mediante evaluaciones periódicas y escalonadas. Los datos tradicionales reflejan la variable dependiente del nivel educativo, es decir, qué tan bien los estudiantes aprenden las materias, qué tan buena es su salud física y mental y cómo se sienten con respecto a la escuela. Estos datos se obtienen enteramente con el conocimiento de los estudiantes y son muy deliberados y opresivos (principalmente a través de exámenes o encuestas a escala), por lo que también ejercerán mucha presión sobre los estudiantes.

Y el big data tiene la capacidad de prestar atención al desempeño microscópico de cada estudiante: cuando abre el libro, sonríe y asiente cuando escucha algo, cuánto tiempo permanece en un tema, cuántas veces se salta diferentes materias. ¿Con cuántos compañeros tomarás la iniciativa de comunicarte? Estos datos no tienen significado para otras personas y representan características de desempeño altamente personalizadas. Al mismo tiempo, la generación de estos datos es completamente procedimental: el proceso de clase, el proceso de los deberes, la interacción entre profesores y alumnos o alumnos… en las acciones y fenómenos que ocurren en cada momento. La integración de estos datos puede explicar el nivel de variables independientes en las microrreformas educativas: ¿Cómo deberían cambiar las aulas para adaptarse a las características psicológicas de los estudiantes? ¿El curso involucra a los estudiantes? ¿Qué tipo de interacciones profesor-alumno son populares? .....Y lo más valioso es que estos datos son completamente observados y recopilados sin el conocimiento de los estudiantes, solo requieren la asistencia de ciertas técnicas y equipos de observación y no afectan el estudio y la vida diaria de los estudiantes, por lo que. Este coleccionismo también es muy natural y auténtico.

Por tanto, partiendo del punto de vista anterior, no nos resulta difícil encontrar que en el ámbito de la educación los datos tradicionales y el big data muestran las siguientes diferencias:

1 Los datos tradicionales explican la situación educativa general y macro, y se utilizan para influir en las decisiones de política educativa; los macrodatos pueden analizar situaciones micro e individuales de estudiantes y aulas, y pueden usarse para ajustar el comportamiento educativo y lograr una educación personalizada.

2. Los métodos tradicionales de minería de datos, los métodos de recopilación, la clasificación de contenido y los criterios de aceptación tienen reglas ya preparadas y metodologías completas para la minería de big data, y actualmente no existen métodos ni rutas claras; y Criterios de evaluación.

3. Los datos tradicionales provienen de evaluaciones por etapas y específicas, y puede haber errores sistemáticos en el proceso de muestreo; los big data provienen de procesos, registros en tiempo real de comportamientos y fenómenos, y errores en la observación y el muestreo. métodos por parte de terceros y tecnologías Pequeñas.

4. Los talentos, habilidades profesionales e instalaciones necesarios para el análisis de datos tradicional son relativamente comunes y fáciles de obtener; la minería de big data tiene altos requisitos de talentos, habilidades profesionales e instalaciones, y los profesionales deben tener una tecnología innovadora. espíritu. Inspírese en la minería de datos, no en las reglas. Estos talentos son muy escasos.

2. Crisis educativa oculta en la era del big data

“Tenemos que admitir que sabemos muy poco sobre nuestros estudiantes” - Este es un estudio de la Facultad de Educación de Universidad Carnegie Mellon Una confesión en la introducción es también el tema central que aparece con mayor frecuencia en las diez principales conferencias anuales sobre educación en los Estados Unidos. Esta falta de conocimiento entre los estudiantes no tuvo ningún impacto negativo en la historia de la educación durante cientos o incluso miles de años antes del siglo XXI. Sin embargo, en la última década después de la revolución de la tecnología de la información, se ha convertido en una enfermedad fatal en el desarrollo. de educación.

“En el pasado, era indiscutiblemente importante que los estudiantes fueran a la escuela para aprender conocimientos. Eso se debía a que las personas tenían muy pocos canales para obtener conocimientos en ese momento y no podían obtener conocimientos sistemáticos sin salir. escuela”, dijo Arne, profesora de la Universidad de Stanford, Arnetha Ball, en el discurso de apertura de la conferencia de la AERA (Asociación Estadounidense de Investigación Educativa). "Sin embargo, la popularidad de Internet ha alejado el estatus de la escuela del altar". Las preocupaciones de Ball no son descabelladas. Según los datos publicados en línea por el censo Kids Count, en 2012, el número de estudiantes educados en el hogar de entre 5 y 17 años en los Estados Unidos alcanzó 1,97 millones, lo que representa una proporción considerable en comparación con la población natal, cuyos precios caen año tras año.

Al mismo tiempo, han surgido clases en línea con contenidos cada vez más sofisticados. Khan Academy, fundada en 2009 y rápidamente se hizo popular en todo el mundo, es un destacado representante. Desde cursos abiertos en prestigiosas universidades hasta Khan Academy, la popularidad de este modelo de aprendizaje en línea simplemente demuestra que el entusiasmo de la gente por aprender no ha desaparecido, pero que la gente está muy ansiosa por despedirse del modelo de enseñanza académica tradicional. El tradicional modelo de enseñanza colectiva, estático e incluso "arrogante", se está adaptando a las necesidades de una población estudiantil cada vez más diversa e individualizada.

El modelo de Khan Academy no solo ayuda a los estudiantes a elegir el contenido que les interesa, sino que también puede saltar rápidamente al nivel de dificultad que más les convenga, mejorando así la eficiencia del aprendizaje. Los alumnos no tienen presión de aprendizaje y pueden controlar por sí mismos la duración, el momento, la ocasión y la cantidad de revisiones.

Es concebible que si el modelo de Khan Academy se desarrolla más y se conecta con el sistema de evaluación adaptativo por computadora (CAT), permitiendo a los usuarios comprender su progreso de aprendizaje a través de la autoevaluación y obtener materiales de aprendizaje con precisión, entonces el Se formará Internet. Las ventajas y la fuerza del "bucle cerrado" del producto serán disruptivas.

Pero si el modelo curricular de la educación tradicional no innova, el formato del aula no cambia y el papel y la conciencia de los docentes no cambian, entonces la existencia de la escuela sólo tendrá significado para los estudiantes que falta de recursos de aprendizaje modernos Para los estudiantes con recursos de aprendizaje más adecuados, ir a la escuela puede ser simplemente para cumplir con las obligaciones impuestas por un rol social, y mucho menos por necesidad, y mucho menos por una experiencia o interés placentero.

La investigación de big data puede ayudar a los investigadores de educación a reexaminar las necesidades de los estudiantes y descubrir qué tipo de cursos, clases y profesores pueden atraer a los estudiantes a través de análisis detallados y de alta tecnología. Pero el problema es que el desarrollo social no da a los investigadores educativos una ventana de tiempo amplia, porque demasiadas personas también están tratando de dividir la limitada energía y atención de los estudiantes a través de la extracción de big data. Y, hasta cierto punto, están mucho más motivados y sinceros que los investigadores en educación.

Los diseñadores de juegos son los primeros en sufrir la peor parte: los adolescentes son su principal grupo de consumidores. Dejando de lado a gigantes internacionales de renombre mundial como Blizzard Entertainment, Electronic Arts y Nintendo de Japón; incluso compañías de juegos nacionales como Shanda Network, The9, Giant Technology y Taomi.com ya han establecido equipos de "experiencia de usuario" profesionales y poderosos. equipo de investigación. Estudiarán cómo utilizar el seguimiento ocular, el seguimiento de la frecuencia cardíaca, el seguimiento de la presión arterial, la velocidad de microoperación del teclado y el mouse y otros microcomportamientos para hacer que los jugadores pasen más tiempo en el juego y estén más dispuestos a gastar dinero del mundo real en artículos. en el mundo virtual. ¿Cuándo debería aparecer el enemigo, qué nivel debería tener y cuánta energía necesita el héroe para derrotarlo? Estas variables han sido diseñadas y controladas estrictamente por una sola razón: los grandes datos les dicen a los creadores de juegos que ese diseño es lo mejor. atractivo para que los jugadores continúen el juego.

La segunda son las industrias culturales en cadena como el cine y la televisión, la novela juvenil, etc. ¿Por qué no puede dejar de ver videos uno tras otro en el sitio web? Porque calculará qué tipo de videos le gusta ver y qué tipo de canciones le gusta escuchar en función del historial de navegación de la cuenta y los votará; sin embargo, la novela más vendida en la red no parece ser "nutritiva", pero la redacción, el número de oraciones, los altibajos de la historia e incluso el tipo de personalidad del protagonista están respaldados por investigaciones relevantes. A los lectores a menudo no les gustan las tramas. con estructuras estrictas y tramas bien diseñadas. Esta es también la razón por la que se prefieren los dramas coreanos con la misma trama. Razones por las que la gente se siente atraída por ellos. A través de repetidas investigaciones sobre las calificaciones, descubrieron los elementos que la audiencia más necesitaba y lo intentaron en todo momento.

Además, hay muchos investigadores más potentes, como los del comercio electrónico, que siempre pueden encontrar productos que usted esté dispuesto a comprar a través de los datos; incluso saben que los padres que compran pañales están más dispuestos a comprar. cerveza. .

Puede parecer que estas áreas no tienen nada que ver con nosotros los educadores, pero están indisolublemente ligadas al objeto de nuestra mayor preocupación: los estudiantes. Hace cientos o incluso décadas, los estudiantes no enfrentaban tantas tentaciones. La escuela juega un papel importante en sus vidas y tiene el mayor impacto en ellos, por lo que los educadores siempre confían en su control sobre los estudiantes. Sin embargo, cuando diferentes organizaciones y productos sociales comienzan a competir por la atención de los estudiantes, la confianza de los educadores sólo puede considerarse como una arrogancia que no puede comprender la situación, porque en esta "batalla por los estudiantes", las escuelas tradicionales parecen realmente no competitivas.

Incluso si los investigadores en educación están dispuestos a dejar de lado su dignidad y utilizar big data para estudiar cuidadosamente las necesidades y personalidades de los estudiantes. Pero la falta de talento también es una seria desventaja: la lentitud y el vacío de la investigación educativa palidecen en comparación con la búsqueda de la validez de la investigación en entornos comerciales. Cuando las empresas de Internet desechen el título de "director de datos", extiendan una rama de olivo a varios expertos en ciencia de datos y se sientan alentadas por el capital de riesgo, la vanguardia de la investigación de big data seguramente seguirá siendo la batalla más intensa en la industria de Internet.

La postura después de analizar la situación, así como la fuerza y ​​la intensidad de la inversión, pueden ser los dos primeros requisitos previos que deben considerarse plenamente al ingresar a la investigación de big data en el campo de la educación.

3. ¿Quién anima al big data?: Ilustración para el estudio de la "naturaleza humana"

A través de la observación, el registro y la extracción incansables de datos masivos, algún día podremos hacerlo. deducir ecuación simple o compleja, dejando así su nombre en el monumento histórico de las ciencias naturales. Este culto a los datos ha sido el credo de físicos, químicos, biólogos y astrogeógrafos durante cientos de años. Los grandes logros de generaciones de maestros como Newton, Bayes y Schrödinger también han revelado el valor infinitamente importante de los datos para el descubrimiento científico.

Por el contrario, la investigación en las ciencias sociales es mucho más sombría: conceden la misma importancia a los datos, persiguen la "justicia procesal" en las estadísticas y el análisis, diseñan diligentemente experimentos y estudios, y encuentran miles de temas, adecuadamente anidados. ecuaciones... pero pocos resultados de investigación son universalmente reconocidos, ya sea en sociología, psicología, economía, administración o educación.

Por supuesto, las dificultades que encuentran los investigadores en el campo de las ciencias sociales son obvias: la "naturaleza humana" es diferente de las "propiedades físicas". El mundo material es relativamente estable y es fácil descubrir reglas; La sociedad compuesta por personas es extremadamente voluble, difícil de generalizar. Desde la perspectiva de los datos, los datos humanos no son tan confiables como los datos físicos:

En primer lugar, las personas no responden con la verdad como lo hacen las cosas: quién sabe cuántos cuestionarios completa una persona debido a la falta de atención, el lenguaje ¿Poca capacidad o ninguna intención de decir la verdad? Además, la brecha entre las personas es mayor que la brecha entre las cosas: dos sustancias con la misma composición química muestran casi las mismas propiedades, pero incluso los gemelos con genes idénticos se comportarán de manera diferente debido a diferentes experiencias de vida y exhibirán características de comportamiento completamente diferentes.

Pero ésta no es la clave. Lo más importante es no estudiar a las personas repetidamente. El hombre no es el bloqueo de Newton, el lanzamiento de peso de Galileo o el perro lobo de Pavlov. La gente no se deslizará por la pendiente una y otra vez, ni será arrojada desde lo alto de Pisa una y otra vez, ni babeará esperando que suene la campana para entregar carne una y otra vez. Y sabemos que entre los tres estándares de la "ciencia", la "verificación reproducible" es el primero.

En otras palabras, los datos que podemos obtener sobre la "naturaleza humana" no son lo suficientemente grandes, no son lo suficientemente abundantes y no están disponibles en ningún momento ni en ningún lugar, por lo que no podemos vislumbrar la naturaleza humana a partir de esos datos. El Premio Nobel de Economía de 2002 fue otorgado al psicólogo Daniel? Daniel Kahneman parece indicar que el campo de las ciencias sociales ha aceptado el hecho de que el comportamiento humano es impredecible, impredecible y difícil de medir científicamente. Las ciencias sociales comenzaron a dudar de que métodos puramente racionales pudieran responder a diversos fenómenos sobre la "naturaleza humana". En contraste, estuvieron las elecciones estadounidenses de 2012. El equipo de Obama se basó en un análisis preciso de los datos en línea para capturar un gran número de votantes "de base". El análisis y la comprensión de sus preferencias y necesidades se ganaron su confianza, ganando así de una sola vez sin ser optimistas sobre las leyes de las encuestas tradicionales. datos históricos. Estos dos acontecimientos históricos que abarcan una década han provocado un cambio dramático en la comprensión de la gente sobre la posibilidad de que “datos revelen la naturaleza humana”.

Hoy en día, Internet y la Internet móvil, que se están popularizando rápidamente, han proporcionado silenciosamente el medio más conveniente y duradero para registrar datos sobre el comportamiento humano. Los terminales que están cerca de las personas, como los teléfonos móviles y los iPads, registran constantemente los pensamientos, decisiones y comportamientos de las personas. Lo más importante es que frente a estos potentes terminales de recopilación de datos la gente no tiene intención de esconderse. Las personas presentan sus experiencias plenamente. Las personas se toman la molestia de repetir comportamientos no deseados una y otra vez en situaciones experimentales, creando así enormes cantidades de datos, algo que no se puede lograr con la investigación de datos tradicional. Muchas de las dificultades con las que luchan los paradigmas de investigación tradicionales son invisibles en el momento en que llega el big data.

La llegada del big data, mediante el desarrollo de tecnologías de vanguardia, ha hecho posible que todos los campos de las ciencias sociales pasen de los macrogrupos a los microindividuos, posibilitando el seguimiento de los datos de todos, haciendo así posible estudiar la "naturaleza humana". Para los investigadores en educación, estamos más cerca que nunca de descubrir estudiantes reales.