Youngin’s Projects
Last updated: 2025-09-14
Professional
데이터/모델 통합 플랫폼 구축 | 2022.02 – 현재
- 로컬/수작업 환경을 데이터/모델 통합 플랫폼으로 전환 → 2년만에 완전 자동화 달성, 현재 신규 개발 및 운영 지속
- 데이터 조회/통합/분석/추출 및 모델 학습/평가/변환을 직관적 UI로 제공하여 누구나 쉽게 데이터와 모델을 활용할 수 있는 셀프서비스 환경 구축 → 사용자 접근성 및 업무 효율성 확보
- 리소스 및 로그 모니터링 대시보드와 실시간 알람 시스템 구현 → 운영 안정성 확보
- CI/CD 파이프라인 구축 및 LLM 기반 자동 코드 리뷰 시스템 개발 → 개발 효율성 및 코드 품질 향상
- DB 파티셔닝, 인덱싱, 쿼리 최적화로 응답 속도 65~99% 개선
기술 스택: Docker, React, Flask, Airflow, Celery, MariaDB, ELK Stack (Elasticsearch, Logstash, Kibana), Filebeat, Prometheus, InfluxDB, Grafana, Jenkins, GitHub Actions, Tensorflow, PyTorch
ML 모델 성능 평가 자동화 시스템 구축 | 2024.10 – 2025.05
- 실제 서비스 시나리오 기반 모델 성능 평가 및 배포 의사결정 지원 시스템 개발
- 기존 수동 테스트 프로세스 자동화로 2주 소요 작업을 20분 내 완료 가능하도록 개선
- 다양한 성능 지표를 동적으로 관리할 수 있는 어드민 페이지와 모델 간 성능 비교 대시보드 구현 → 경험적 판단에서 데이터 기반 정량적 모델 선택으로 전환
- 기존 TensorFlow 전용 예측 서버를 PyTorch까지 지원하도록 확장하고, 프레임워크별 모델 포맷을 공통 인터페이스로 통합하여 멀티 프레임워크 통합 환경 구축 → 운영 효율성 및 신규 프레임워크 확장 가능성 확보
기술 스택: React, Flask, FastAPI, Celery, TensorFlow, PyTorch
데이터셋 품질 평가 및 모니터링 시스템 구축 | 2024.04 – 2024.10
- 데이터셋 버전 간 품질 개선 효과를 정량적으로 설명하기 어려운 문제 해결을 위한 평가 시스템 개발
- 관련 논문 리서치 및 경험적 지표 수치화를 통해 체계적인 품질 평가 지표 선정 및 표준화
- 버전 간 성능 비교 및 클래스별 취약점 분석이 가능한 QA 대시보드 구현 → 데이터 기반 개선 프로젝트 4배 증가, 전체 품질 지표 12% 및 모델 관련 지표 45% 향상, 품질 향상 속도 1.6배 가속화
- 새로운 데이터셋 업데이트 시 자동 예측 및 지표 계산, 관련자 알람 발송 시스템 구축 → 수동 모니터링 작업 자동화
기술 스택: React, Flask, FastAPI, Celery, TensorFlow
모델 벤치마크 평가 기능 구축 | 2024.02 – 2024.03
- 내부 데이터셋 의존 평가의 한계를 해결하기 위해 공개 벤치마크 데이터셋 도입 → 모델 신뢰성과 객관적 비교 기준 확보
- 모듈화된 평가 아키텍처 설계로 기존 불가능했던 새로운 벤치마크 추가를 1일 내 완료 가능하도록 구현 → 벤치마크 확장성 및 평가 체계 유연성 확보
- 내부/외부 모델 성능을 통합 대시보드로 정량화·시각화하여 객관적 성능 비교 환경 구축 → 데이터 기반 모델 개선 방향성 및 대외 공신력 확보
기술 스택: React, Flask, Celery, TensorFlow
데이터 검수 시스템 구축 | 2023.02 – 2023.03
- 기존 부재했던 데이터 품질 관리 체계를 새롭게 구축하여 사내 표준 검수 프로세스 확립 → 데이터 품질 통제 및 일관성 확보
- 검수 워크플로우 툴, 어드민 페이지, 통계 대시보드 통합 개발 → 사용자별 검수 현황 실시간 추적 및 오류 패턴 분석 가능
- 데이터 파이프라인·모델 관리 플랫폼과 연계하여 품질-학습-배포까지 일관성 있는 라이프사이클 관리 달성
기술 스택: React, Flask, Airflow
데이터 메타데이터 관리 시스템 | 2022.10 – 2023.05
- 산재된 메타데이터(개인 지식, 문서 파일, 로컬 저장소)를 중앙화, 표준화한 통합 데이터 카탈로그 시스템 개발 → 불가능했던 데이터 검색을 완전 자동화로 전환
- 수집 환경(날짜, 경로, 날씨, 기기, 거리), 도메인 속성(차종, 분류, 엔진 타입) 등 다층적 메타데이터 스키마 설계 → 세밀한 데이터 분류 및 추적 체계 구축
- 다중 조건 필터링 검색 기능 개발로 복잡한 데이터 요구사항 즉시 대응 → 데이터 사이언티스트/분석가의 데이터 발견 효율성 극대화
- 실시간 메타데이터 CRUD 웹 인터페이스 구현 → 기존 수작업 메타데이터 관리 프로세스 완전 자동화
기술 스택: React, Flask, MySQL
클러스터링 기반 데이터 분석 플랫폼 | 2022.07 – 2022.09
- 다양한 임베딩 모델(내부/외부 모델)을 활용한 클러스터링 분석 플랫폼 구축 → 비전문가도 클릭만으로 고급 데이터 분석 수행 가능
- 다중 클러스터링 알고리즘(K-means, DBSCAN)과 차원축소 옵션을 선택형 인터페이스로 제공하여 하이퍼파라미터 실험 환경 구축 → 동일 데이터로 다양한 분석 방법론 비교 분석 가능
- 내부 등록 데이터와 사용자 커스텀 데이터 통합 분석 기능 개발 → 데이터 활용도 및 분석 유연성 극대화
- 복잡한 ML 워크플로우를 원클릭 실행이 가능한 직관적 인터페이스로 구현 → 전문 지식 없이도 고급 데이터 분석 접근성 확보
- 비동기 작업 처리 시스템 구현으로 대용량 데이터 분석 시 안정적인 성능 보장
기술 스택: Flask, React, Celery, TensorFlow
AI Coach 운동 코치 안드로이드 앱 | 2021.11 – 2022.01
- MediaPipe Pose 기반 실시간 운동 자세 분석 안드로이드 앱 개발 → AI 기반 개인 맞춤형 운동 코칭 서비스 구현
- 모바일 환경 최적화를 통한 실시간 영상 처리 및 정확한 동작 피드백 시스템 구축 → 배터리 효율성과 성능 안정성 확보
- Bazel 기반 크로스 플랫폼 빌드 환경 구축으로 AAR 형태 모델 패키징 → 안드로이드 스튜디오 종속성 제거 및 다중 플랫폼 확장성 확보
기술 스택: Android Studio, Java, MediaPipe, Bazel, OpenCV, TensorFlow Lite
음성 기반 점수 평가 자동화 시스템 구축 | 2021.10 – 2021.11
- 기존 수작업 음성-점수 변환 프로세스를 완전 자동화 → 인력 의존도 100% 제거, 처리 시간 85% 단축
- STT API 연동 → 데이터 라벨링 → 분류 모델 학습까지 End-to-End ML 파이프라인 구축 → 모델 정확도 92% 달성
- 실시간 음성 데이터 처리 및 자동 분류 시스템 개발 → 24/7 무인 운영 환경 구축
- 데이터 품질 검증 및 모델 성능 모니터링 시스템 구현 → 서비스 안정성 확보
기술 스택: Python, TensorFlow
Personal
[연세대학교 공학대학원] 실시간 네트워크 공격 탐지 플랫폼 PRISM 구축 | 2025.03 – 2025.06
컴퓨터소프트웨어학과 졸업프로젝트 우수상 수상
- LUCID CNN 모델 재구현 및 CIC-IDS-2017 기반 다중 분류 모델 확장 → 이진 분류에서 다양한 공격 유형(Port Scan, Brute Force, Slowloris 등) 탐지로 실용성 향상
- 클래스 불균형 데이터 언더샘플링 및 소수 클래스 통합을 통한 모델 최적화 → F1 Score 0.83에서 0.889로 개선, 정확도 90.2% 달성
- Kafka-Spark 기반 확장형 실시간 데이터 파이프라인 구축으로 패킷 수집부터 예측까지 완전 자동화 → 평균 61ms 응답시간의 준실시간 탐지 성능 확보
- Elasticsearch-Kibana 통합 대시보드로 시간대·IP·공격 유형별 다차원 분석 환경 제공 → 보안 운영자의 신속한 위협 인지 및 대응 지원
- 메모리 1GB 이하 경량 아키텍처 설계 → 저사양 환경에서도 안정적 운영 및 인프라 비용 절감 달성
기술 스택: Python, Kafka, Spark, Elasticsearch, Kibana, TensorFlow
GitHub:
- 모델 개발: lucid-ddos
- 전체 시스템: prism
[연세대학교 공학대학원] 개인 맞춤형 피트니스 코칭 서비스 FitGuru | 2024.11 – 2024.12
- LLM 기반 개인 맞춤형 피트니스 코칭 서비스 MVP 개발
- 사용자 운동·식단 로그를 LLM 프롬프트에 동적 반영하여 개인별 운동 루틴 추천, 식단 상담, 체성분 분석 기능 제공
- Google App Script로 CRUD API 및 Gemini 연동 로직 구현, React 웹 앱 개발 후 Netlify로 배포 → 간단한 MVP 아키텍처로 하루 만에 빠른 프로토타이핑
기술 스택: React, Google App Script, Google Gemini API (LLM), Netlify
GitHub: yonsei_fitguru
Blog: FitGuru
[연세대학교 공학대학원] Future Frame Prediction 모델 개선 프로젝트 | 2023.11 – 2023.12
- 기존 CNN 기반 비디오 이상탐지 모델 대비 AUC 2% 향상(0.9515 → 0.9647) 달성
- Transformer(ViViT) 기반 구조 도입으로 Long-range Temporal Relation 보존 성능 강화
- Optical Flow 모듈 최적화(LiteFlowNet) 및 Loss Function 개선(Perceptual Loss 추가)으로 예측 품질 고도화
- 연구 결과를 오픈소스로 공개하여 reproducibility 확보 및 후속 연구 활용 기반 제공
기술 스택: PyTorch, TensorBoard, U-Net, Transformer(ViViT), Optical Flow, Computer Vision
GitHub: Anomaly_Prediction
Blog: Future Frame Prediction 모델 개선 프로젝트
[한양대학교SW융합교육원] 채팅 메시지 분석 ML-Bot ‘JAVAS’ | 2021.06 – 2021.08
- PM으로 6명 팀 리딩, Kafka–Spark Streaming 기반 대규모 실시간 ML 파이프라인(21개 컨테이너, 18개 서비스) 설계 및 구축
- GPU 최적화 및 분산처리 아키텍처 개선으로 반응 속도 13초 → 5초(62% 개선), ML 정확도 85.62% → 88.76%(+3.14%p) 달성
- YouTube, Twitch, 네이버 쇼핑라이브 등 멀티 플랫폼 채팅 데이터 실시간 수집 및 감정 분석, 비속어 필터링, 실시간 워드클라우드 서비스 제공
- OOM 문제 해결을 위한 형태소 분석 결과 재사용 구조 리팩토링 → 메모리 사용량 절감 및 안정적 실시간 처리 환경 확보
- Grafana 기반 대시보드로 Spark/Kafka/웹서비스 전체 실시간 모니터링 체계 구축
기술 스택: Docker, Python, Flask, Kafka, Spark Streaming, MongoDB, Grafana, InfluxDB, Elasticsearch, Logstash
GitHub: 21_hyu_javas
Blog: JAVAS
[한양대학교SW융합교육원] 머신러닝 기반 식품 영양정보 웹서비스 ‘알고먹조’ | 2021.05 – 2021.06
- PM으로 5명 팀 리딩 및 풀스택 개발 담당, 4일간 집중 개발로 Kafka–Spark 기반 실시간 데이터 파이프라인 구축 및 이미지 학습 데이터 자동 수집
- Azure Custom Vision API 연동 및 URL 기반 학습 구조 설계로 저장소 사용량 절감 및 학습 효율성 개선
- Flask 기반 검색 기능(이미지/범위/키워드) 구현으로 사용자 식품 영양정보 접근성 강화
- 한글 태그 인코딩 최적화(인덱스 변환) 및 템플릿 상속 활용으로 Kafka 전송 속도 개선 및 UI 일관성 확보
기술 스택: Python, Flask, Selenium, Kafka, Spark, MariaDB, Azure Custom Vision API
GitHub: 21_hyu_algomeokjo Blog: 알고먹조