Método Científico y la Ciencia de Datos
Cómo se emplea el método científico en la elaboración de proyectos de ciencia de datos
INTRODUCCIÓN
La mayoría de las organizaciones se gestionan con base a la siguiente metodología: planificar, establecer objetivos y medir resultados. Por lo que dividen en proyectos, equipos de trabajo y gestionan con una oficina de proyectos.
Un proyecto típico tiene requisitos, alcance y un cronograma, pero los equipos de ciencia de datos no trabajan en proyectos, son equipos exploratorios, por los que se centran en la exploración del conocimiento y tratar de aportar conocimientos.
En el caso de la ciencia de datos, la “ciencia” se refiere al uso del método científico, los siguientes conceptos fueron tomados del libro de Doug Rose, Data Science: Create Teams That Ask the Right Questions and Deliver Real Value.
DESARROLLO
Los conceptos que integran el método científico en la elaboración de un proyecto en ciencia de datos.
Como un proyecto de ciencia de datos es exploratorio, tiene conceptos del método científico como:
- Observación: Se recopilan datos sobre el fenómeno que se está estudiando.
- Problema: Se realizan preguntas interesantes sobre los datos recopilados.
- Hipótesis: Se realizan inferencias sobre la relación de los datos y se investigan.
- Experimento: Se crean modelos para corroborar las hipótesis.
- Resultados: Se analizan los resultados y se crean conocimientos.
Los criterios de éxito de un proyecto de ciencia de datos se basan en la pregunta ¿aprendimos algo nuevo?
El enfoque del método científico bajo la problemática de un proyecto de ciencia de datos
El Método científico sirve para realizar investigaciones y describir y explicar la naturaleza, intentando en última instancia probar o refutar teorías, se utiliza para validar las observaciones y minimizar el sesgo del observador. Su objetivo es que la investigación se lleve a cabo de manera justa, imparcial y repetible.
El Proceso del método científico incluye los siguientes pasos:
PASO 1.Haga una OBSERVACIÓN: recopile y asimile información sobre un evento, fenómeno, proceso o una excepción a una observación anterior, etc.
PASO 2. Defina el PROBLEMA: haga preguntas sobre la observación que sean relevantes y comprobables. Defina la hipótesis nula para proporcionar resultados no sesgados.
PASO 3: Forme la HIPÓTESIS: cree una explicación, o una suposición fundamentada, para la observación que sea comprobable y falsable.
PASO 4: Realice el EXPERIMENTO: elabore y realice un experimento para probar la hipótesis.
PASO 5: Derive una TEORÍA: cree una declaración basada en el resultado del experimento que explique la (s) observación (es) y prediga la probabilidad de observaciones futuras.
Este enfoque se aplica a un proyecto de ciencia de datos, ya que no se puede adaptar al método de gestión de proyectos en donde el entregable está definido, en un proyecto de ciencia de datos el proceso es igual a la investigación científica, preguntar cómo y por qué suceden ciertos eventos, buscando comprender las relaciones y complejidades entre causa y efecto para predecir los resultados de eventos futuros o similares. El Método Científico requiere que hagamos preguntas y realicemos experimentos para probar o refutar preguntas de manera que conduzcan a respuestas imparciales. En un proyecto de ciencia de datos de la misma manera, se hacen las preguntas con base en la observación de los datos y se diseñan experimentos para proporcionar resultados precisos y repetibles.
CONCLUSIÓN
Debido al proceso de la ciencia de datos de descubrir y difundir nueva información, el método científico es la forma en que se deben trabajar estos proyectos, ya que se generan hipótesis de trabajo que se validan con experimentos repetibles por cualquier persona, en cualquier lugar, proporcionando respuestas imparciales a preguntas para derivar en teorías y predecir valores.
REFERENCIAS
Doug Rose. (2016). Data Science: Create Teams That Ask the Right Questions and Deliver Real Value. USA: Apress.
Maria Ryan,Angela O’Callaghan. The Scientific Method. University of Nevada, Fact Sheet-02–66.