2024년에 풀스택 데이터 과학자가 되는 방법

내 꿈이었던 직업은 데이터 과학자가 되는 것이었습니다. 이 끝없는 여정은 2021년 9월 7일에 시작되었습니다. 고등학교 때부터 컴퓨터 과학에 관심을 가졌습니다. 삶은 나를 산업계의 생산 엔지니어로 이끌었습니다. 경력 동안 많은 데이터 주도 비즈니스 개발 프로젝트를 수행했습니다. 코로나 시기 이후, 내 열정을 찾고 미래로 나아가기로 결심했습니다. 파이썬 프로그래밍 언어를 배우기 시작했습니다. 학습 습관을 형성하는 데 74일이 걸렸습니다. 학습을 멈추지 않았습니다. 파이썬이 데이터 과학에서 가장 인기 있는 언어임을 알아보고 목표를 데이터 과학 분야로 변경했습니다. 제 생애 13년을 제조 엔지니어로 보낸 뒤에 데이터 과학이 경력 전환에 가장 적합한 분야임을 깨달았습니다.

항상 기초가 중요하다고 믿었습니다. 파이썬에 몰두했습니다. 6개월이 걸렸습니다. 동시에 Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn 같은 파이썬의 인기 있는 라이브러리를 배우기 시작했습니다. 또한 데이터 과학 부트캠프에 등록했습니다. 성장 마인드셋을 채택했습니다. 가치 있는 데이터 과학 소셜 네트워크를 구축했습니다. 새로운 데이터 과학 기회를 얻을 수 있는 기술을 표현하는 자신감을 얻었습니다. 3개월 후에 데이터 관련 직무를 시작했습니다.

새로운 역할을 맡은 때에도 아직 달성해야 할 목표가 있었습니다. 기대치를 높였습니다. 프로그래밍의 객체 지향 접근법을 배웠습니다. 객체 지향 프로그래밍을 잘 이해하기 위해 자바 프로그래밍 언어를 공부했고, 이 접근법을 파이썬을 사용해 데이터 과학 프로젝트에 적용했습니다. 예측 분석을 위한 파이프라인을 구축했습니다. 이를 통해 확장 가능하고 유연한 모델과 유지 보수가 쉬운 보고 도구를 구축할 수 있었습니다. 상사들로부터 매우 감명깊은 피드백을 받았습니다. 이는 제 동기부여에 도움이 되었습니다.

이번 성공 이후, 경쟁 예측 분석 도구를 해킹하기 위해 역공학을 수행했습니다. 예측 분석을 위한 클러스터링 머신 러닝 알고리즘의 나만의 버전을 만들었고, 아직 개발 중에 있습니다.

이 기간 동안 GPT 시스템에 대한 혹평에 실망했습니다. GPT 시스템을 해킹할 방법을 찾기 시작했고, V자형 직원이 데이터 과학에서 더 많은 잠재력을 가지고 있다는 것을 발견했습니다. 클라우드 컴퓨팅이 미래라고 생각했고, 풀 스택 데이터 과학자가 되는 목표를 세웠습니다. 이 모델에서 데이터 과학에 대한 심도 있는 지식을 개발하고, 데이터 엔지니어링, 데이터 분석, 프로젝트 관리, 소프트웨어 엔지니어링, ML/AI 엔지니어링 및 DevOps 지식을 확장하고 싶습니다.

AWS, Azure 및 GCP의 기본 클라우드 컴퓨팅 자격증 준비를 시작했습니다. Europe와 미국의 수요가 많은 기술을 찾기 위해 LinkedIn의 구인 게시판을 분석했으며, 아래 목록을 만들었습니다. 더 추가하고 싶은 항목이 있으면 댓글을 남겨주세요. 데이터 과학에 대한 열정이 계속됩니다.

Agile
Amazon Kinesis
Apache Airflow
Apache Cassandra
Apache Hadoop
Apache Hive
Apache Kafka
Apache Spark
Apheris
ARIMA
Atlassian Bitbucket -AWS
AWS Athena
AWS Bedrock
AWS Glue
AWS Redshift
AWS S3
AWS SageMaker
Azure
Azure AI Services
Azure CosmosDB
Azure Data factory
Azure Data Lake
Azure Data storage
Azure Databricks
Azure HDInsight
Azure Machine Learning Studio
Azure SQL
Azure Stream Analytics
Azure Synapse Analytics
Bash
Bigquery
C
C#
C++
Catboost
CI/CD
Circle CI
Databricks
Datashield
DAX
DBT
Deep Learning
DevOps
Digital Signal Processing
Docker
DOMO
Elasticsearch
ETL
FA/FL
Fast Fourier Analysis
FastAPI
Feature Engineering
Fivetran
FPGA
GCP
GCP Looker
Git
GitHub
GitLab
GraphQL
IBM Cognos Analytics
Java
Javascript
Jenkins
Jupyter
Kubeflow
Kubernetes
LangChain
LightGBM
Linux
LLM
LSTM
Matplotlib
Metabase
Microsoft 365
Microsoft Language Studio
Microsoft SQL Server
MLflow
Monai
MongoDB
MySQL
NLP
NLTK
NoSQL
Numpy
Nvidia Flare
NWP
OOP
OpenAI API
OpenCL
Oracle
Pandas
PostgreSQL
Power BI
PySpark
Pytest
Python
PyTorch
QlikSense
Qlikview
R
RAG
Rest API
SAS
Scala
Scikit-learn
Scipy
Scrum
SDLC
Snowflake
Spacy
Spinnaker
SQL
SQLAlchemy
Streamlit
Tableau
Tensorflow
Tensorflow Lite
Time Series
Travis CI
Vector Database
XGBoost