티스토리 뷰

책요약

쉽고 빠르게 익히는 실전 LLM

따강아지 2024. 3. 24. 23:08

"LLM (Large Language Models)은 대부분 트랜스포머 아키텍처에서 파생된(반드시 그렇지는 않지만) AI 모델로, 사람의 언어, 코드 등을 이해하고 생성하기 위해 설계되었습니다." 즉 *LLM (Large Language Models)**은 방대한 양의 자연어 데이터를 처리하고 종종 사람이 생성한 텍스트와 구별할 수 없는 응답을 생성할 수 있는 인공 지능 시스템입니다.

LLM을 훈련시키는 방법은 1. 텍스트 데이터 수집, 2. 데이터 정리(전처리), 3. 데이터 분할, 4. 모델 설정(LLM의 구조 정의), 5.모델 훈련으로 진행이 되는데 이 도서는 3개의 파트 (1 LLM 소개 , 2 LLM 활용법, 3 고급 LLM 사용법) 와  4 부록으로 단계별 지침, 모범 사례, 실제 사례 연구, 실습 예제를 통해서 소개하고 있습니다. 

LLM을 빠르게 이해하기 하기흘 원하는 독자를 위해 그림과 예제를 통해서 소개하고 있으며 의미 기반 검색으로 시작으로 프롬프트 엔지니어링에 대해서 소개하고 파트 2에서 파인튜닝, 프로프트 엔지니어링 고급 주제, 레이블이 없는 방대한 데이터 세트에서 훈련된 AI 신경망으로, 텍스트 번역, 의료 이미징 등 다양한 작업을 수행하는 파운데이션 모델을 추천 시스템 만들기 사례연구를 시작으로 다양한 사례를 통해 파인튜닝, 트랜스포머등에 대해서 소개하고 있으면 다양한 방법을 제시하고 있습니다.

마지막으로 부록에서 LLM 자주 묻는 질문(FAQ),  LLM 용어 해설, LLM 애플리케이션 개발 고려사항에 알려 주고 있습니다.

일반 개발자로 살아온 나에게는 패이스북, 카카오 등 많은 SNS에 있는 오픈 쳇에서 이야기하는 것들을 이해하기 위해 별도의 시간을 내어서 공부해야 하는 개념을 이 도서를 통해서 빠르게 알 수 있어서 좋았습니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

'책요약' 카테고리의 다른 글

겐트 벡의 Tidy First  (0) 2024.05.26
챗 GPT API를 활용한 챗봇 만들기  (0) 2024.04.28
밑바닥부터 시작하는 딥러닝 4  (0) 2024.02.25
Release의 모든 것  (0) 2023.12.25
핸즈온 머신러닝(3판)  (0) 2023.10.29