Hoon

ML Systems Data Engineering

ML은 빅데이터의 성장과 맞물려 있습니다. 대규모 데이터 시스템은 복잡하며 표준과 도구가 빠르게 변합니다. 이 글은 데이터 소스 → 데이터 포맷/저장 방식 → 데이터 모델(관계형·NoSQL) 순서로 기초를 정리하여, 실무에서 흔히 마주치는 선택지를 이해하도록 돕습니다. 프로세스 간 데이터 전달 방식과 배치/스트림 처리의 구분은 후속 글에서 다룹니다. ...

ML Systems Basic

머신러닝 시스템은 단순히 모델만을 개발하는 것이 아니라, 비즈니스 목표, 데이터, 인프라, 배포, 모니터링 등 다양한 요소가 유기적으로 결합되어야 합니다. 머신러닝 시스템 설계의 핵심 요소와 요구사항, 그리고 반복적 개발 프로세스를 정리했습니다. 1. 비즈니스와 ML 목표 머신러닝 시스템을 개발하기 전에 가장 먼저 고려해야 할 것은 왜 이 시...

Deep Learning Start

출처: 사이토 고키, 『밑바닥부터 시작하는 딥러닝』 (2017) 본 문서는 4장: 신경망 학습의 내용을 정리한 것입니다. 딥러닝 모델을 사용하려면 반드시 학습 과정을 거쳐야 합니다. 학습이란 훈련 데이터로부터 가중치와 편향 같은 매개변수의 최적값을 자동으로 찾아내는 과정을 의미합니다. 이때 모델이 올바르게 학습하도록 이끌어주는 것이 바로 손실 함수...

Graph Search Algorithm

그래프는 노드(정점)와 간선으로 구성된 자료구조로, 다양한 실세계 상황을 모델링하는 데 사용됩니다. 소셜 네트워크, 도로 체계, 컴퓨터 네트워크 등 많은 시스템이 그래프로 표현될 수 있습니다. 그래프 탐색 알고리즘은 이러한 구조를 체계적으로 순회하고 분석하는 방법을 제공합니다. 그래프 표현 방식은 크게 인접 행렬(Adjacency Matrix)과...