El mejor IDE para Data Science 2020 - The Data Samuel (2023)

¿Está a punto de comenzar su viaje de ciencia de datos o ya está en él y busca mejoras? Entonces seguramente de alguna manera te enfrentarás tarde o temprano con esta pregunta:

¿Qué IDE usaré para mi trabajo?

Para responder a esto, necesitamos saber de antemano qué lenguaje de programación usa. Hay tres opciones. (Solo miraré esos. Sé que hay varias otras opciones. Pero los que utiliza principalmente la comunidad de ciencia de datos son los tres enumerados)

  1. Pitón
  2. R
  3. ambos

Pitón

Primero, veremos Python. En el caso de Python, tenemos que tomar una decisión realmente difícil. Hay un montón de buenos editores por ahí. Pero para darte un pequeño adelanto: ninguno de ellos supera a los demás. Podría hacer una lista enorme de posibles editores para Python. Pero para ser honesto, ciertamente no los probé todos.

Solo hay cuatro (tal vez cinco)

  1. espía
  2. PyCharm
  3. VisualStudioCode
  4. Cuadernos Jupyter / Jupyter Lab
  5. Rodeo

1. Espía

El mejor IDE para Data Science 2020 - The Data Samuel (1)

Probablemente uno de los IDE más subestimados para Data Science. No se ve muy bien, pero fue desarrollado específicamente para el campo. Actualmente, en enero de 2020 se actualiza a la Versión 4 y tieneCometaintegrado. ¿Qué tiene de especial Spyder y por qué, en mi opinión, es uno de los mejores editores para Data Science? Como ya se mencionó, fue construido para Data Science. Y vemos esto directamente cuando iniciamos el editor. Como científico de datos, hacemos una gran cantidad de importación de datos, manipulación de datos, trazado y quizás construcción de modelos. Para este propósito, tenemos muchas variables que almacenamos. Lo que es necesario en este caso, es un explorador de variables.

Con Spyder, esto está directamente integrado en la parte superior derecha de la ventana. Por lo tanto, podemos ver todas las variables almacenadas, su tipo y también algunos de los valores. Entonces, si es nuevo en el campo, puede pensar bien, ¿es esto tan importante? Déjame decirte simplemente esto:¡ES!

En breve me adelanto con un hecho sobre Jupyter Notebooks. Por supuesto, son muy buenos para conectar la codificación y la creación de un informe. Pero, ¿alguna vez te has encontrado con el problema de recordar tus variables? esto es enorme Y con un explorador de variables, podemos encontrarlos al instante. Sí, hay formas de implementar un explorador de variables en Jupyter Notebooks, pero no están preinstaladas (todavía).

El mejor IDE para Data Science 2020 - The Data Samuel (2)

hay aún más

Además, puede crear fragmentos en sus scripts de Spider. En estos fragmentos, puede ejecutar secciones de su código que quizás desee mantener juntas. Esto es bastante similar a las celdas de código en Notebooks. Además, incluso podemos decidir entre el trazado en línea o en el explorador de trazado adicional. Finalmente, también podemos ejecutar Jupyter Notebooks en Spyder. Esto es genial.

Spyder también contiene funciones como la finalización de código (incluso ampliada ahora con Kite) y resaltado de sintaxis. Deberías probarlo. Si desea instalar Spyder, la mejor manera esdescargar anaconda.

2. PyCharm

PyCharm es desarrollado por JetBrains. Si conoce Java, es posible que ya haya oído hablar de ellos. Hicieron un famoso IDE de Java, el IntelliJ IDEA. PyCharm IDE está disponible gratuitamente en una Community Edition. Además, también ofrecen una edición profesional con cosas más avanzadas. Estoy usando este IDE con mucha frecuencia para la codificación general. Se ve muy bien y viene con muchas características como:

  • Editor inteligente de Python
  • Depurador gráfico y corredor de pruebas
  • Navegación y Refactorizaciones
  • Inspecciones de código
  • soporte de VCS

También puede elegir entre diferentes temas para su IDE. Además, si ya tiene instalado Anaconda, puede usarlo directamente como entorno de su proyecto. También permite la integración directa con Kite. Entonces, la finalización del código obtiene algún avance.

El mejor IDE para Data Science 2020 - The Data Samuel (3)

es simplemente genial

Debe haber un inconveniente?

Una vez más, muchos datos positivos sobre este IDE. ¿Pero hay puntos negativos? En realidad, no puedo contarte sobre la edición profesional. La Community Edition, sin embargo, también carece de un explorador de variables. Podemos ver las variables en la consola, pero ¿quién quiere codificar todo el análisis allí? Además, solo la edición profesional puede leer y escribir .ipynb para escribir cuadernos.

Pero es un gran IDE y definitivamente puedo recomendarlo. Finalmente, también puede expandirlo agregando algunos complementos. Si desea verificar este IDE, vaya aCEREBROS DE JET.

3. Código de estudio visual

El mejor IDE para Data Science 2020 - The Data Samuel (4)

Un editor de Microsoft para todo. Este IDE es quizás mi IDE de Python favorito. Viene con una tonelada de herramientas integradas. Resaltado de sintaxis y autocompletado con IntelliSense que proporciona sugerencias basadas en módulos importados, etc. (Similar a Kite pero estuvo allí mucho más tiempo) Además, también tiene el depurador directamente en el editor. Además, los comandos GIT también están integrados. Estos son utilizables directamente desde el editor. Además, también hay muchas extensiones disponibles. Finalmente, este editor es adecuado para muchos idiomas.

El modo Zen

El mejor IDE para Data Science 2020 - The Data Samuel (5)

Quieres mantenerte enfocado y codificar tu cosa. Simplemente inicie el modo Zen. Con este modo, no existe nada más que usted y su código. Ofreciendo un gran enfoque para sus tareas. Además, este editor ofrece un explorador de variables y también la posibilidad de ejecutar Notebooks. Esto convierte a VS-Code en uno de los mejores (si no el) mejor editor para Python.

¿Problemas?

Una desventaja que experimenté con este editor es el IntelliSense mencionado positivamente. A veces parece que la finalización no funciona correctamente. Espero que esto se mejore en el futuro y también a través de Kite. ¡Definitivamente échale un vistazo!Descarga aquí.

4. Cuadernos Jupyter / JupyterLab

El mejor IDE para Data Science 2020 - The Data Samuel (6)

Los cuadernos se ejecutan como una aplicación web que le permite crear informes presentables con visualizaciones en línea que pueden ser reactivas. Como podemos ver existe la posibilidad de crear los llamados Notebooks. Con estos, podemos crear análisis con texto y explicaciones añadidos directamente. Tiene algo así como finalización de código pero, en mi opinión, no puedes ver si las cosas sugeridas por el editor pertenecen allí o no. Además, no tenemos un explorador de variables omnipresente excepto que instalamos uno. Existe la posibilidad de instalar uno, pero si no lo hemos instalado, debe usar comandos mágicos. pero escribiendo%OMSconstantemente para obtener todo el medio ambiente es un poco ineficiente.

Pero también podemos usar un Notebook y ejecutar diferentes idiomas en cada celda. Esto es bastante poderoso cuando combinamos lo mejor de cada lenguaje de programación.

Hay una estrella potencial

Los portátiles tienen algunas características interesantes, pero cuando echamos un vistazo a los de JupyterLab, vemos aún más potencial.

JupyterLab es un entorno de desarrollo interactivo basado en web para cuadernos, código y datos de Jupyter. JupyterLab es flexible: configure y organice la interfaz de usuario para admitir una amplia gama de flujos de trabajo en ciencia de datos, computación científica y aprendizaje automático. JupyterLab es extensible y modular: escriba complementos que agreguen nuevos componentes y se integren con los existentes.

https://jupyter.org/

El mejor IDE para Data Science 2020 - The Data Samuel (7)

Nos permite combinar la fuerza de los portátiles con ajustes individuales. Por ejemplo, ejecute Notebooks en diferentes idiomas en paralelo. O muestre los resultados de los gráficos justo al lado de su computadora portátil. Esto es bastante prometedor y veremos cómo se desarrollará.

Si tiene Anaconda, Jupyter Notebook y Lab se instalan directamente. De lo contrario, miraaquíPara descubrir mas.

5. Rodeo

El mejor IDE para Data Science 2020 - The Data Samuel (8)

Esta es una sugerencia bastante complicada en este momento. Rodeo a menudo se llama Rstudio para Python. (Si quieres saber por qué esto es bueno/impresionante, sigue leyendo también la sección R) Rodeo está inspirado en RStudio. Tiene todas las cosas geniales que necesita un IDE de ciencia de datos, como un explorador de variables o un administrador de gráficos. Podemos ejecutar Python, Markdown o incluso SQL en este IDE. Desafortunadamente, Rodeo actualmente ya no está en desarrollo. Espero que alguien continúe desarrollando esto más porque este sería probablemente el mejor IDE de ciencia de datos para Python.

R

Sin embargo, la elección con R es mucho más fácil. Para ser honesto, tengo que pensar mucho en otros IDE para elegirel único. Voy a enumerar ahora tres de los posibles R IDE, pero solo investigaré uno de ellos de forma intensiva.

  • RStudio
  • código de estudio visual
  • Cuaderno Jupyter / JupyterLab

1. RStudio

El mejor IDE para Data Science 2020 - The Data Samuel (9)

En primer lugar, RStudio tiene todas las cosas que consideré importantes. No solo un explorador de variables y un explorador de gráficos y la página de ayuda integrada. Tenemos integración GIT y R Markdown. Con esto, podemos escribir Notebooks que son reproducibles y pueden ejecutar múltiples lenguajes como R, Python y SQL.

R Markdown admite docenas de formatos de salida estáticos y dinámicos, incluidosHTML ⧉,PDF ⧉,Microsoft Word ⧉,Proyector ⧉,Diapositivas HTML5 ⧉,Folletos estilo Tufte ⧉,libros ⧉,tableros,aplicaciones brillantes ⧉,artículos científicos ⧉,sitios web ⧉, y más.

https://rmarkdown.rstudio.com/

La finalización de código en RStudio es simplemente increíble. Puede presionar la pestaña cuando lo desee y le mostrará las variables para su posición actual. Además, podemos hacer scripts en varios otros idiomas para nuestro análisis. Finalmente, también podemos integrar un sistema de gestión de paquetes que nos permite almacenar diferentes versiones de paquetes en cada proyecto dentro de RStudio. Estoy planeando hacer una publicación en el blog sobre esto más adelante. ¡Úsalo! Eso es genial. Descargaloaquí.

En resumen, debo decir que RStudio se adapta a todas las necesidades de un científico de datos. Y sería genial ver un IDE de Python que sea como RStudio. (tal vez Rodeo) Pero probablemente sea el mejor IDE para Data Science si trabaja principalmente con R.

2. Código de estudio visual

Una vez más, arriba en la lista está Visual Studio Code. También podemos usar este gran IDE para R. No entraré en detalles porque ya escuchamos algunos datos sobre este. Y como ya he dicho, me gusta mucho. Solo necesitas descargar la extensión R.

El mejor IDE para Data Science 2020 - The Data Samuel (10)

3. Cuadernos Jupyter / JupyterLab

Otro candidato familiar aquí. Jupyter Notebooks and Lab también puede ejecutar un kernel R. Entonces podemos escribir scripts R e informes también con R. ¡Muy bien!

El mejor IDE para Data Science 2020 - The Data Samuel (11)

Conclusión

Así que hay soluciones poderosas para ambos idiomas. Dependiendo de sus necesidades, puede usarlos todos, tienen fortalezas y debilidades. Estas son mis sugerencias finales:

Estás enfocado en un lenguaje de programación

Para Python, puedes decidir cuál te gusta más: Spyder, Visual Studio Code o Notebooks. Con estos tres puede crear informes y diseñar informes reproducibles. Para R, sin embargo, en mi opinión, solo hay una opción: Rstudio. También puede usar Jupyter, pero RStudio está diseñado para R y Data Science y encaja perfectamente allí.

Quieres usar ambos, Python y R

Entonces la elección es más difícil. Pero Visual Studio Code puede escribir scripts en ambos idiomas. Del mismo modo, Jupyter Lab también es capaz de ejecutar ambos y permite el ajuste individual de la interfaz de usuario. Esta es una buena característica. Para fines de colaboración y control de versiones, elegiría Visual Studio Code sobre Jupyter. Pero siéntete libre de elegir.

En realidad los conseguí todos.

Sí, todos los IDE mencionados en esta publicación (e incluso algunos más) están instalados en mi sistema. Y cambio frecuentemente entre ellos dependiendo del propósito. Así que siéntete libre de probarlos todos y decidir cuál se adapta mejor a tus necesidades personales.

Espero que haya disfrutado de esta publicación y haya obtenido información que lo ayude a elegir su IDE para 2020 o lo inspire a reconsiderar su elección actual. Déjame saber lo que piensas sobre los IDE y esta publicación.

Muchas Gracias Por Leer. ¡Siéntete libre de comentar!

References

Top Articles
Latest Posts
Article information

Author: Lilliana Bartoletti

Last Updated: 07/08/2023

Views: 5251

Rating: 4.2 / 5 (53 voted)

Reviews: 92% of readers found this page helpful

Author information

Name: Lilliana Bartoletti

Birthday: 1999-11-18

Address: 58866 Tricia Spurs, North Melvinberg, HI 91346-3774

Phone: +50616620367928

Job: Real-Estate Liaison

Hobby: Graffiti, Astronomy, Handball, Magic, Origami, Fashion, Foreign language learning

Introduction: My name is Lilliana Bartoletti, I am a adventurous, pleasant, shiny, beautiful, handsome, zealous, tasty person who loves writing and wants to share my knowledge and understanding with you.