Youngin’s Projects

August 24, 2021

Last updated: 2025-09-14

Professional

데이터/모델 통합 플랫폼 구축 | 2022.02 – 현재

로컬/수작업 환경을 데이터/모델 통합 플랫폼으로 전환 → 2년만에 완전 자동화 달성, 현재 신규 개발 및 운영 지속
데이터 조회/통합/분석/추출 및 모델 학습/평가/변환을 직관적 UI로 제공하여 누구나 쉽게 데이터와 모델을 활용할 수 있는 셀프서비스 환경 구축 → 사용자 접근성 및 업무 효율성 확보
리소스 및 로그 모니터링 대시보드와 실시간 알람 시스템 구현 → 운영 안정성 확보
CI/CD 파이프라인 구축 및 LLM 기반 자동 코드 리뷰 시스템 개발 → 개발 효율성 및 코드 품질 향상
주요 성능 최적화 사례:
- DB 파티셔닝, 인덱싱, 쿼리 최적화로 응답 속도 65~99% 개선
- 키-값 기반 임베딩 캐싱 시스템으로 모델 평가 시간 65% 단축 및 GPU/외부 서버 의존성 제거
- 배치 인퍼런스 및 데이터 적재 최적화로 수백만 건 데이터 분석 시간 7일→1일 단축

기술 스택: Docker, React, Flask, Airflow, Celery, MariaDB, ELK Stack (Elasticsearch, Logstash, Kibana), Filebeat, Prometheus, InfluxDB, Grafana, Jenkins, GitHub Actions, Tensorflow, PyTorch

ML 모델 성능 평가 자동화 시스템 구축 | 2024.10 – 2025.05

실제 서비스 시나리오 기반 모델 성능 평가 및 배포 의사결정 지원 시스템 개발
기존 수동 테스트 프로세스 자동화로 2주 소요 작업을 20분 내 완료 가능하도록 개선
다양한 성능 지표를 동적으로 관리할 수 있는 어드민 페이지와 모델 간 성능 비교 대시보드 구현 → 경험적 판단에서 데이터 기반 정량적 모델 선택으로 전환
기존 TensorFlow 전용 예측 서버를 PyTorch까지 지원하도록 확장하고, 프레임워크별 모델 포맷을 공통 인터페이스로 통합하여 멀티 프레임워크 통합 환경 구축 → 운영 효율성 및 신규 프레임워크 확장 가능성 확보

기술 스택: React, Flask, FastAPI, Celery, TensorFlow, PyTorch

데이터셋 품질 평가 및 모니터링 시스템 구축 | 2024.04 – 2024.10

데이터셋 버전 간 품질 개선 효과를 정량적으로 설명하기 어려운 문제 해결을 위한 평가 시스템 개발
관련 논문 리서치 및 경험적 지표 수치화를 통해 체계적인 품질 평가 지표 선정 및 표준화
버전 간 성능 비교 및 클래스별 취약점 분석이 가능한 QA 대시보드 구현 → 데이터 기반 개선 프로젝트 4배 증가, 전체 품질 지표 12% 및 모델 관련 지표 45% 향상, 품질 향상 속도 1.6배 가속화
새로운 데이터셋 업데이트 시 자동 예측 및 지표 계산, 관련자 알람 발송 시스템 구축 → 수동 모니터링 작업 자동화

기술 스택: React, Flask, FastAPI, Celery, TensorFlow

모델 벤치마크 평가 기능 구축 | 2024.02 – 2024.03

내부 데이터셋 의존 평가의 한계를 해결하기 위해 공개 벤치마크 데이터셋 도입 → 모델 신뢰성과 객관적 비교 기준 확보
모듈화된 평가 아키텍처 설계로 기존 불가능했던 새로운 벤치마크 추가를 1일 내 완료 가능하도록 구현 → 벤치마크 확장성 및 평가 체계 유연성 확보
내부/외부 모델 성능을 통합 대시보드로 정량화·시각화하여 객관적 성능 비교 환경 구축 → 데이터 기반 모델 개선 방향성 및 대외 공신력 확보

기술 스택: React, Flask, Celery, TensorFlow

모델 정량 평가 파이프라인 최적화 | 2023.03 – 2023.08

평가 서버 GPU 부재로 인한 외부 의존성 및 성능 문제 해결
키-값 기반 임베딩 캐싱 시스템 구현으로 학습-평가 단계 분리 → 학습 시 ID별 임베딩을 파일 저장, 평가 시 저장된 임베딩 활용
CPU 기반 예측으로 전환하여 GPU 인프라 비용 절감 및 평가 시간 65% 단축
외부 서버 호출 제거로 평가 파이프라인 독립성 확보 → 운영 안정성 향상

기술 스택: Python, NumPy, Flask, TensorFlow/PyTorch

데이터 검수 시스템 구축 | 2023.02 – 2023.03

기존 부재했던 데이터 품질 관리 체계를 새롭게 구축하여 사내 표준 검수 프로세스 확립 → 데이터 품질 통제 및 일관성 확보
검수 워크플로우 툴, 어드민 페이지, 통계 대시보드 통합 개발 → 사용자별 검수 현황 실시간 추적 및 오류 패턴 분석 가능
데이터 파이프라인·모델 관리 플랫폼과 연계하여 품질-학습-배포까지 일관성 있는 라이프사이클 관리 달성

기술 스택: React, Flask, Airflow

데이터 메타데이터 관리 시스템 | 2022.10 – 2023.05

산재된 메타데이터(개인 지식, 문서 파일, 로컬 저장소)를 중앙화, 표준화한 통합 데이터 카탈로그 시스템 개발 → 불가능했던 데이터 검색을 완전 자동화로 전환
수집 환경(날짜, 경로, 날씨, 기기, 거리), 도메인 속성(차종, 분류, 엔진 타입) 등 다층적 메타데이터 스키마 설계 → 세밀한 데이터 분류 및 추적 체계 구축
다중 조건 필터링 검색 기능 개발로 복잡한 데이터 요구사항 즉시 대응 → 데이터 사이언티스트/분석가의 데이터 발견 효율성 극대화
실시간 메타데이터 CRUD 웹 인터페이스 구현 → 기존 수작업 메타데이터 관리 프로세스 완전 자동화

기술 스택: React, Flask, MySQL

클러스터링 기반 데이터 분석 플랫폼 | 2022.07 – 2022.09

다양한 임베딩 모델(내부/외부 모델)을 활용한 클러스터링 분석 플랫폼 구축 → 비전문가도 클릭만으로 고급 데이터 분석 수행 가능
다중 클러스터링 알고리즘(K-means, DBSCAN)과 차원축소 옵션을 선택형 인터페이스로 제공하여 하이퍼파라미터 실험 환경 구축 → 동일 데이터로 다양한 분석 방법론 비교 분석 가능
내부 등록 데이터와 사용자 커스텀 데이터 통합 분석 기능 개발 → 데이터 활용도 및 분석 유연성 극대화
복잡한 ML 워크플로우를 원클릭 실행이 가능한 직관적 인터페이스로 구현 → 전문 지식 없이도 고급 데이터 분석 접근성 확보
비동기 작업 처리 시스템 구현으로 대용량 데이터 분석 시 안정적인 성능 보장

기술 스택: Flask, React, Celery, TensorFlow

AI Coach 운동 코치 안드로이드 앱 | 2021.11 – 2022.01

MediaPipe Pose 기반 실시간 운동 자세 분석 코칭 서비스 구현
Bazel을 활용하여 MediaPipe 기반 모델을 AAR 형태로 패키징, 네트워크 독립적인 온디바이스 AI 환경 구축
실시간 영상 처리 및 포즈 인식 알고리즘 최적화로 모바일 환경 내 저지연 피드백 시스템 구현

기술 스택: Android Studio, Java, MediaPipe, Bazel, OpenCV, TensorFlow Lite

음성 기반 점수 평가 자동화 시스템 구축 | 2021.10 – 2021.11

기존 수작업 음성-점수 변환 프로세스를 전 과정 자동화하여 인적 의존성 제거
Pipeline: 영상 내 오디오 추출 → STT(Speech-to-Text) 변환 → Classification 모델 학습 및 예측으로 이어지는 데이터 워크플로우 설계.

기술 스택: Python, TensorFlow

Personal

[연세대학교 공학대학원] 실시간 네트워크 공격 탐지 플랫폼 PRISM 구축 | 2025.03 – 2025.06

컴퓨터소프트웨어학과 졸업프로젝트 우수상 수상

LUCID CNN 모델 재구현 및 CIC-IDS-2017 기반 다중 분류 모델 확장 → 이진 분류에서 다양한 공격 유형(Port Scan, Brute Force, Slowloris 등) 탐지로 실용성 향상
클래스 불균형 데이터 언더샘플링 및 소수 클래스 통합을 통한 모델 최적화 → F1 Score 0.83에서 0.889로 개선, 정확도 90.2% 달성
Kafka-Spark 기반 확장형 실시간 데이터 파이프라인 구축으로 패킷 수집부터 예측까지 완전 자동화 → 평균 61ms 응답시간의 준실시간 탐지 성능 확보
Elasticsearch-Kibana 통합 대시보드로 시간대·IP·공격 유형별 다차원 분석 환경 제공 → 보안 운영자의 신속한 위협 인지 및 대응 지원
메모리 1GB 이하 경량 아키텍처 설계 → 저사양 환경에서도 안정적 운영 및 인프라 비용 절감 달성

기술 스택: Python, Kafka, Spark, Elasticsearch, Kibana, TensorFlow

GitHub:

모델 개발: lucid-ddos
전체 시스템: prism

[연세대학교 공학대학원] 개인 맞춤형 피트니스 코칭 서비스 FitGuru | 2024.11 – 2024.12

LLM 기반 개인 맞춤형 피트니스 코칭 서비스 MVP 개발
사용자 운동·식단 로그를 LLM 프롬프트에 동적 반영하여 개인별 운동 루틴 추천, 식단 상담, 체성분 분석 기능 제공
Google App Script로 CRUD API 및 Gemini 연동 로직 구현, React 웹 앱 개발 후 Netlify로 배포 → 간단한 MVP 아키텍처로 하루 만에 빠른 프로토타이핑

기술 스택: React, Google App Script, Google Gemini API (LLM), Netlify

GitHub: yonsei_fitguru
Blog: FitGuru

[연세대학교 공학대학원] Future Frame Prediction 모델 개선 프로젝트 | 2023.11 – 2023.12

기존 CNN 기반 비디오 이상탐지 모델 대비 AUC 2% 향상(0.9515 → 0.9647) 달성
Transformer(ViViT) 기반 구조 도입으로 Long-range Temporal Relation 보존 성능 강화
Optical Flow 모듈 최적화(LiteFlowNet) 및 Loss Function 개선(Perceptual Loss 추가)으로 예측 품질 고도화
연구 결과를 오픈소스로 공개하여 reproducibility 확보 및 후속 연구 활용 기반 제공

기술 스택: PyTorch, TensorBoard, U-Net, Transformer(ViViT), Optical Flow, Computer Vision

GitHub: Anomaly_Prediction
Blog: Future Frame Prediction 모델 개선 프로젝트

[한양대학교SW융합교육원] 채팅 메시지 분석 ML-Bot ‘JAVAS’ | 2021.06 – 2021.08

PM으로 6명 팀 리딩, Kafka–Spark Streaming 기반 대규모 실시간 ML 파이프라인(21개 컨테이너, 18개 서비스) 설계 및 구축
GPU 최적화 및 분산처리 아키텍처 개선으로 반응 속도 13초 → 5초(62% 개선), ML 정확도 85.62% → 88.76%(+3.14%p) 달성
YouTube, Twitch, 네이버 쇼핑라이브 등 멀티 플랫폼 채팅 데이터 실시간 수집 및 감정 분석, 비속어 필터링, 실시간 워드클라우드 서비스 제공
OOM 문제 해결을 위한 형태소 분석 결과 재사용 구조 리팩토링 → 메모리 사용량 절감 및 안정적 실시간 처리 환경 확보
Grafana 기반 대시보드로 Spark/Kafka/웹서비스 전체 실시간 모니터링 체계 구축

기술 스택: Docker, Python, Flask, Kafka, Spark Streaming, MongoDB, Grafana, InfluxDB, Elasticsearch, Logstash

GitHub: 21_hyu_javas
Blog: JAVAS

[한양대학교SW융합교육원] 머신러닝 기반 식품 영양정보 웹서비스 ‘알고먹조’ | 2021.05 – 2021.06

PM으로 5명 팀 리딩 및 풀스택 개발 담당, 4일간 집중 개발로 Kafka–Spark 기반 실시간 데이터 파이프라인 구축 및 이미지 학습 데이터 자동 수집
Azure Custom Vision API 연동 및 URL 기반 학습 구조 설계로 저장소 사용량 절감 및 학습 효율성 개선
Flask 기반 검색 기능(이미지/범위/키워드) 구현으로 사용자 식품 영양정보 접근성 강화
한글 태그 인코딩 최적화(인덱스 변환) 및 템플릿 상속 활용으로 Kafka 전송 속도 개선 및 UI 일관성 확보

기술 스택: Python, Flask, Selenium, Kafka, Spark, MariaDB, Azure Custom Vision API

GitHub: 21_hyu_algomeokjo Blog: 알고먹조

Twitter Facebook LinkedIn

Caju