티스토리 뷰

본 서평은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

머신러닝 파이프라인을 한번 잘 만들어두면 그 안에서 모델을 바꾸거나 실험을 통해 세부적인 사항을 바꾸면 되지요.
실무의 입장으로 보면, 사내에서 자체구축을 하기위해 바닥부터 만드는 경우도 있고
책과 같이 잘 되어있는 플랫폼, 프레임워크, 라이브러리 등을 차용하여 빠르게 구축하는 경우도 있겠습니다.
저는 전자인 바닥부터 만드는 경우의 환경을 경험해봤습니다만 이것으로 인한 장단점이 나뉘는 것 같습니다.

선호를 따지자면, 이미 잘 되어있고 검증된 것을 가져다 써서 빠르게 파이프라인을 구축하고
모델 실험이나 데이터 분석에 주력을 하는 것을 더 선호하지만
제 선호도 만으로 결정할 수 있는 부분은 아니다보니 이런저런 아쉬움이 있습니다.
머신러닝 파이프라인의 개념, 소개 그리고 TFX를 활용한 파이프라인 구축이 책의 전반적은 내용 인데요.

제 경험에 빗대보자면, 바닥부터 만들다보니 파이프라인 내에서 필요성을 통감하면서도 
서비스 제공에 보다 중요한 모델 학습과 배포에 대부분 집중했던 것 같습니다.
데이터의 버전화, 데이터의 유효성 확인 및 데이터 드리프트의 확인
모델 검증 절차, 학습의 추적, 튜닝모델의 검증, 피드백 루프 등에 대해선
깊이 다뤄보지못한 부분이 많이 아쉽습니다.

현재 실무에서 머신러닝 엔지니어로서 자사 솔루션, 플랫폼의 자체개발에도 역량을 쏟으시는 분들은
본 책에 나오는 도구들을 (이미 알고계실 수도 있겠지만) 낱낱히 파헤쳐 필요한 기능을 뽑아 개발하시는 것도 좋을 것이라 생각합니다.