Last updated: 2025-08-23

기본 정보

신영인

데이터 엔지니어

  • 이메일: younginshin115@gmail.com
  • 블로그: https://younginshin115.github.io
  • GitHub: https://github.com/younginshin115

기술 스택

  • Languages: Python, Java, JavaScript
  • Data Processing: Spark, Kafka
  • Orchestration: Airflow, Celery
  • Databases: MySQL, PostgreSQL, MongoDB, InfluxDB
  • Frameworks: Flask, FastAPI, React
  • Machine Learning: TensorFlow, PyTorch
  • Cloud: GCP, Azure, AWS
  • DevOps: Docker, Jenkins, GitHub Actions, Nginx
  • Monitoring: Elastic Stack, Grafana

경력

코클

데이터 엔지니어
2022.02 ~ (재직 중) | 정규직 | 사원

주요 업무

  • 데이터 관리 및 품질 유지
  • 사내 데이터·모델 관리 플랫폼 개발 및 운영
  • 데이터 파이프라인 구축 및 자동화
  • 모델 학습, 평가, 배포 등 모델 라이프사이클 자동화 및 관리
  • 데이터베이스 설계 및 성능 최적화

비알프레임

데이터 엔지니어
2021.09 ~ 2022.02 (6개월) | 정규직 | 주임

주요 업무

  • 머신러닝 기반 데이터(영상·음성·텍스트) 전처리 모듈 개발 및 운영
  • 머신러닝 기반 네이티브 안드로이드 앱(Java/Android Studio) 개발 및 배포
  • 최신 논문 및 모델 리서치를 기반으로 성능 검증 및 최적화 수행
  • 국가 연구 개발 프로젝트 일정 관리·협력사 조율 및 프로젝트 전반 운영

로그러스아이티코리아

프로젝트 매니저
2018.11 ~ 2020.03 (1년 5개월) | 정규직 | 사원

주요 업무

  • 국내외 고객사 60곳과 협력하여 번역, 디자인, 웹개발 등 다분야 프로젝트 기획·운영
  • 시장 분석, 비용 산정, 제안서 작성 등 영업 운영 지원
  • 고객사·협력사·프리랜서 일정·품질 조율 및 관리

프로젝트

데이터/모델 통합 플랫폼 구축 | 2022.02 – 현재

  • 로컬/수작업 환경을 데이터/모델 통합 플랫폼으로 전환 → 2년만에 완전 자동화 달성, 현재 신규 개발 및 운영 지속
  • 데이터 조회/통합/분석/추출 및 모델 학습/평가/변환을 직관적 UI로 제공하여 누구나 쉽게 데이터와 모델을 활용할 수 있는 셀프서비스 환경 구축 → 사용자 접근성 및 업무 효율성 확보
  • 리소스 및 로그 모니터링 대시보드와 실시간 알람 시스템 구현 → 운영 안정성 확보
  • CI/CD 파이프라인 구축 및 LLM 기반 자동 코드 리뷰 시스템 개발 → 개발 효율성 및 코드 품질 향상
  • DB 파티셔닝, 인덱싱, 쿼리 최적화로 응답 속도 65~99% 개선

기술 스택: React, Flask, Airflow, Celery, MariaDB, ELK Stack (Elasticsearch, Logstash, Kibana), Filebeat, Prometheus, InfluxDB, Grafana, Jenkins, GitHub Actions

ML 모델 성능 평가 자동화 시스템 구축 | 2024.10 – 2025.05

  • 실제 서비스 시나리오 기반 모델 성능 평가 및 배포 의사결정 지원 시스템 개발
  • 기존 수동 테스트 프로세스 자동화로 2주 소요 작업을 20분 내 완료 가능하도록 개선
  • 다양한 성능 지표를 동적으로 관리할 수 있는 어드민 페이지와 모델 간 성능 비교 대시보드 구현 → 경험적 판단에서 데이터 기반 정량적 모델 선택으로 전환
  • 기존 TensorFlow 전용 예측 서버를 PyTorch까지 지원하도록 확장하고, 프레임워크별 모델 포맷을 공통 인터페이스로 통합하여 멀티 프레임워크 통합 환경 구축 → 운영 효율성 및 신규 프레임워크 확장 가능성 확보

기술 스택: React, Flask, FastAPI, Celery, TensorFlow, PyTorch

데이터셋 품질 평가 및 모니터링 시스템 구축 | 2024.04 – 2024.10

  • 데이터셋 버전 간 품질 개선 효과를 정량적으로 설명하기 어려운 문제 해결을 위한 평가 시스템 개발
  • 관련 논문 리서치 및 경험적 지표 수치화를 통해 체계적인 품질 평가 지표 선정 및 표준화
  • 버전 간 성능 비교 및 클래스별 취약점 분석이 가능한 QA 대시보드 구현 → 데이터 기반 개선 프로젝트 4배 증가, 전체 품질 지표 12% 및 모델 관련 지표 45% 향상, 품질 향상 속도 1.6배 가속화
  • 새로운 데이터셋 업데이트 시 자동 예측 및 지표 계산, 관련자 알람 발송 시스템 구축 → 수동 모니터링 작업 자동화

기술 스택: React, Flask, FastAPI, Celery, TensorFlow

[대학원 프로젝트] 실시간 네트워크 공격 탐지 플랫폼 PRISM 구축 | 2025.03 – 2025.06

  • 대용량 네트워크 트래픽 실시간 처리 및 분석을 위한 확장 가능한 데이터 파이프라인 설계 및 구축
  • 대규모 네트워크 트래픽을 Kafka + Spark Structured Streaming 기반 확장형 데이터 파이프라인으로 실시간 처리 및 분석, 평균 61ms 지연 시간으로 준실시간 탐지 성능 확보
  • 클래스 불균형 데이터 전처리 자동화 및 배치 처리 최적화를 통해 모델 예측 정확도 7% 향상 → 운영 안정성 확보
  • ELK 스택 기반 대시보드 및 알람 시스템 구현으로 실시간 공격 탐지 및 운영 모니터링 자동화 → 지표 기반 운영 효율성 향상
  • 메모리 사용량 1GB 이하 경량 아키텍처 설계로 인프라 비용 절감 및 수평 확장성 보장
  • 컴퓨터소프트웨어학과 우수 프로젝트 선정 및 우수상 수상

기술 스택: Python, Kafka, Spark, Elasticsearch, Kibana, TensorFlow

GitHub:

  • 모델 개발: https://github.com/younginshin115/lucid-ddos
  • 전체 시스템: https://github.com/younginshin115/prism

학력

연세대학교 공학대학원

  • 기간: 2023.09 ~ 2025.08 (졸업 예정)
  • 전공: 컴퓨터소프트웨어학과
  • GPA: 4.26 / 4.3
  • Relevant Coursework: 데이터 엔지니어링, 소프트웨어공학, GPU/병렬 프로그래밍, AI 시스템 최적화, 이상 탐지 모델링

가천대학교

  • 기간: 2010.03 ~ 2017.02
  • 전공: 행정학과
  • GPA: 4.15 / 4.5

성남외국어고등학교

  • 기간: 2007.03 ~ 2010.02
  • 전공: 독일어학과

교육

Google Cloud Monthly Advanced Workshop – Security & Network | 2024.02

  • Google Cloud 보안 정책 운영 및 IAM 기반 접근 제어, VPC 네트워크 설계 관련 심화 실습

Databricks Bootcamp – Learn how to build a Lakehouse architecture | 2023.05

  • Lakehouse 아키텍처 이해 및 Delta Lake, Databricks SQL, MLflow 기반 데이터 엔지니어링 실습

PBL 센서데이터 활용 빅데이터 전문가 과정 | 2021.03-2021.08

  • 기관: 한양대학교 소프트웨어융합교육원
  • 내용: 데이터 파이프라인 구축 및 머신러닝 기반 웹 서비스 개발

과학기술 기계학습 데이터 구축사업 | 2021.01

  • 기관 - 한국과학기술정보연구원
  • 내용 - 머신러닝 기본 지식 학습 후, 텍스트 데이터를 HTML로 가공하여 기계학습용 데이터셋 구축 과정 참여

대외활동

데이터야놀자 발표 - 나홀로 생존기 | 2025.06

  • 팀내 단독 개발자로 3년간 사내 플랫폼을 구축·운영하며 서버 안정성 확보, 데이터 기반 의사결정, 자동화 파이프라인 도입까지의 경험과 전략 공유

사내 기술 세미나 발표 | 2023.03-2024.12

  • How is the model evaluated? – 모델 평가 지표 및 방법론 소개와 이를 기반으로 개발한 사내 평가 툴 시연 (2024.12.12)
  • How does the data team measure and manage data quality? – 사내 데이터 품질 지표 정의 및 이를 기반으로 한 자동화 파이프라인과 대시보드 구축 사례 소개 (2024.11.21)
  • Sound AI for Beginners – 사운드 AI 개요 및 최신 기술 동향 발표 (2024.03.21)
  • What happens after learning a model – 모델 학습 이후의 conversion, evaluation, packaging, deployment 과정을 자동화하는 사내 툴 개발 및 적용 사례 소개 (2023.08.24)
  • Let’s make my own sound classification model with the enter key only! – 사내 초급자 대상 사운드 분류 모델 실습 세션 진행 (2023.06.01)
  • The adventures of data (feat. Internal data platform) – 사내 데이터 플랫폼 구축 및 데이터 활용 사례 소개 (2023.03.16)

Google BigQuery ML 해커톤 (User Churn Prediction) | 2023.04

  • BigQuery ML과 Kaggle 플랫폼을 활용해 대규모 데이터셋 기반 유저 이탈 예측 모델 개발

스터디 활동 | 2021.03-2023.09

  • 개발 블로그 작성 스터디 - 개발 경험과 학습 내용을 기술 문서로 작성·공유하여 지식 확산 및 커뮤니케이션 능력 향상 (2022.08-2023.09)
  • 머신러닝, 딥러닝 논문 스터디 - 최신 논문 분석을 통한 연구 동향 파악 및 기술 트렌드 이해 (2021.10-2022.02)
  • Java Spring 스터디 – 토이 프로젝트를 진행하며 객체지향 설계 원리(SOLID)를 학습하고 코드 구조화 역량 강화 (2021.04-2021.06)
  • Python 알고리즘 스터디 - 알고리즘 문제 풀이 및 코드 리뷰로 문제 해결 능력 향상 (2021.03-2021.09)
  • Hadoop Ecosystem과 Elastic stack 스터디 - 대규모 데이터 처리 및 로그 분석 환경 리서치, 토이 프로젝트 진행 (2021.03-2021.05)

외국어

영어 | 비즈니스 레벨

  • TOEIC Speaking: 170 / Level 7 (2020.06.14)
  • TOEIC: 950 (2020.05.31)

일본어 | 일상 회화 레벨벨

  • JLPT N2 (2025.01.10)