인공지능은 정말 빠르게 발전하고 있다.만약 내가 2년전에 이 글을 썼다면 머신러닝, 딥러닝에 대한 내용을 작성하면서 데이터가 얼마나 중요한 요소인지 설명하는 글을 적었을 것이다. 지금은 내가 강조하지 않아도 AI를 사용하는데 데이터가 얼마나 중요한지 모두가 알고 있다.
요즘은 머신러닝, 딥러닝보다 LLM을 활용하고자 하는 기업이 엄청 많아졌다. 챗GPT의 등장으로 많은 사람들이 LLM에 대한 접근이 쉬워졌기 때문에 이를 활용하고자 하는 사람들도 많아졌다고 생각한다. 챗GPT를 보면 내가 특별히 어떤 데이터를 주지 않아도 대답을 너무 잘하기 때문에 LLM을 활용하고자 할 때 데이터는 별로 중요한 것 처럼 느껴지지 않는다. 하지만 이전 글을 보면 알 수 있듯이 LLM은 '생성'을 잘하는 머신러닝 모델 중 하나로, 모델 크기가 거대하기 때문에 우리랑 대화가 잘 통하는 것 처럼 느껴질 뿐이지 LLM을 사용할 때도 데이터는 중요하다. AI도입 시 특정 업무나 사용자 요구에 맞게 LLM을 최적화하려면 프롬프트 튜닝이 필수적이며, 이 과정에서 데이터를 어떻게 준비하고 활용하느냐가 AI도입 성패를 좌우한다.
프롬프트 엔지니어링과 프롬프트 튜닝이란?
프롬프트 엔지니어링은 챗GPT와 같은 LLM을 사용할 때 적절하게 지시문(프롬프트)을 작성하는 기술을 뜻한다.
만들어져 있는 LLM은 이미 100억개의 단어들을 학습한 엄청 큰 모델이다. 이 모델을 두고 원하는 답변을 출력하도록 지시문을 최적하하는 것이다. 예를들어 "이 글을 요약해줘" 라고 두루뭉실하게 지시문을 작성하는 대신 "너는 평론가야. 이 글을 보고 장단점을 포함하여 세 문장으로 간단히 요약해줘" 처럼 질문이나 명령을 더 구체적이고 효과적으로 작성하는 과정이다.
비유를 해보자면, 유명한 피아니스트가 이미 "나비야"라는 곡을 치고 있다면 "이 곡을 더 천천히 연주해줘"라고 요청하는 것이다. 이 때 우리는 연주자를 바꾸거나, 연주곡을 바꾸는 것이 아닌 '말'을 통해 원하는 연주 스타일로 연주를 요청하는 것이다.
프롬프트 튜닝은 100억개의 단어를 학습한 LLM에 추가로 학습할 수 있는 데이터를 주입해 작업에 더 잘 맞게 모델을 미세 조정하는 과정을 뜻한다. 특정 업무나 사용자 요구에 맞는 데이터를 모델에 입력하면 모델 내부에서 입력된 데이터와 비슷한 데이터에 대한 값을 조정하여 특정 부분에 대한 대답을 더 잘 할 수 있게 한다.
유명한 피아니스트는 다양한 곡을 칠 수 있지만, 특별히 '모차르트의 악보를 전달'(=프롬프트 튜닝)하고 이 곡을 연습하라고 하면 다른 곡보다 모차르트의 곡을 전문으로 연주하는 피아니스트가 되는 것이다.
그럼 모델 학습과 프롬프트 튜닝의 차이는 뭘까?
모델 학습은 모델의 전체적인 성능을 개성하거나 새로운 도메인 지식을 추가하기 위해 대규모 데이터셋을 사용해 처음부터 다시 학습하거나 기존에 학습한 것을 두고 추가로 학습하는 것을 말한다.
처음부터 학습한다는 의미는 이미 100억개의 단어를 학습한 LLM을 초기화하고, 내가 원하는 도메인에 맞는 데이터를 준비하여 학습시키는 것이다. 이 경우, 100억개 단어에 해당하는 데이터를 준비하고, 이를 학습시킬 수 있는 장비를 세팅해야 한다.
추가로 학습한다는 의미는 기존에 100억개의 단어를 학습한 LLM에 내가 준비한 데이터를 추가로 학습시키는 것을 뜻한다. 내가 1000개의 데이터를 준비해 학습시킨다고 해도, 이미 방대한 데이터를 학습한 모델에서는 약 0.0000001% 정도의 영향을 미칠 뿐이다. 심지어 이를 학습시키기기 위해서는 비싼 장비 세팅도 필수다.
이를 비유하자면, 유명한 피아니스트가 기억상실에 걸린 뒤 클래식, 재즈, 팝 등 모든 장르를 처음부터 다시 배우는 과정과 같다.
프롬프트 튜닝에서 데이터가 중요한 이유
정확성: 원하는 답변을 이끌어내는 핵심 요소
프롬프트 튜닝에서 사용되는 데이터는 모델이 정확한 답을 도출하도록 돕는 역할을 한다.
예를 들어, 고객 응대용 AI를 튜닝하려면, 고객이 자주 묻는 질문과 이에 대한 정확한 답변이 포함된 데이터셋이 필요하다.
컨텍스트: 상황에 맞는 응답을 유도
프롬프트 튜닝에 적절한 데이터를 전달하면 특정 상황(컨텍스트)를 기반으로 응답을 생성할 수 있도록 돕는다. 프롬프트 튜닝 시, 어떤 상황에서 어떤 결과를 원할지 정의한 데이터가 중요하다. 예를 들어, 법률 분야에서 LLM을 활용한다면, 법조 문서와 사례 데이터가 포함된 프롬프트 데이터를 통해 모델의 맥락 이해를 도와야 한다.
다양성: 편향 없는 모델 구축
LLM은 제공된 데이터에 따라 결과가 달라질 수 있다. 만약 데이터가 특정 그룹이나 상황에만 치우쳐 있다면 다양한 사용 사례와 시나리오를 포함한 데이터가 없다면, 특정 그룹이나 상황에 대해 부적절한 결과를 생성할 위험이 있다. 예를 들어, 제품 추천 AI가 특정 사용자 그룹에만 최적화되어 있다면, 다른 그룹에서는 만족도를 떨어뜨릴 수 있다.
AI(LLM)를 도입할 때 고려해야 할 점
비용과 ROI 분석
딥러닝을 도입하고자 할 때도 하드웨어 비용은 비용계산에서 가장 중요한 요소였다. LLM은 딥러닝보다 훨씬 큰 모델이기 때문에 모델 학습은 OpenAI와 같은 거대기업에서 시도할 수 있는 부분이고, AI도입에 돈을 좀 쓸 수 있는 상황이라면 프롬프트 튜닝에 들어가는 비용을 계산해야 한다. 튜닝에 사용할 품질 좋은 데이터는 충분한지, LLM을 튜닝시킬 수 있는 적절한 하드웨어가 있는지, 튜닝 기술을 가지고 있는 인적자원이 있는지 확인해야 한다.
비용을 가장 적게 들일 수 있는 항목은 LLM 프롬프트 엔지니어링이다. 튜닝이나 학습을 하지 않기 때문에 LLM을 사용할 수 있는 환경만 갖춰지면 된다. GPT와 같은 모델을 사용한다면 하드웨어와 상관없이 LLM을 도입하여 사용할 수 있다. 하지만, AI를 도입했을 때 들어가는 투자비용 대비 그 결과가 얼마나 좋을지는 면밀하게 분석해야한다.
AI는 도구일 뿐, 전략이 필요하다
이전 글에서도 이야기 했듯이 AI는 자동으로 문제를 해결하는 마법의 기술이 아니다. 기업이 해결하고자 하는 문제와 목표에 따라 오히려 AI를 도입하지 않고 문제를 해결하는게 훨씬 좋은 결과를 보일수도 있다. 때문에 AI도입하기 전 어떻게 준비해야하는지, 어떤 결과물이 나오는지 컨설팅 등을 통해 미리 알아보고 잘 도입할 수 있는 전략을 짜는 것이 중요하다.
지속 가능한 AI 환경 구축
LLM을 도입한 이후에 바로 100% 만족하는 성능을 기대하기 어렵다. 우리도 챗GPT를 사용하다 보면 내 생각만큼 잘 대답하지 못하는 부분이 있기때문에 기업이 LLM을 도입하게 된다면 충분한 AS기간을 가지는 것이 좋다. 실사용하면서 지속적으로 개발자에게 피드백을 전달한다면 개발자는 프롬프트 엔지니어링으로 커버할 수 있는 최대한의 성능으로 프롬프트를 세팅해줄 것이다.
결론
LLM을 무조건 도입한다고 모든 문제가 해결되는 것은 아니다. 특히 오늘은 프롬프트 엔지니어링과 튜닝에 대해 이야기 했는데, LLM을 도입할 때 모델학습, 프롬프트 튜닝, 프롬프트 엔지니어링에 대해서 명확히 구분할 수 있다면 더 적은 비용으로 더 효과적인 성과를 만들어낼 수 있다.
성공적인 AI 도입을 위해 다음과 같은 점을 기억하자:
- 문제를 명확하게 정의하라: 단순히 AI를 도입하고 싶다는 접근이 아니라 명확한 문제를 가지고 해결방안 중 하나로 AI도입을 고려해봐야 한다. 비용이나 성능 문제로 때로는 AI를 도입하는 것보다 다른 방법으로 문제를 해결하는게 더 효과적일 수 있다.
- 작게 시작하고 점진적으로 확장하라: LLM 도입은 특히나 생긴지 얼마 안 된 기술이기 때문에 처음부터 크게 도입하는 것은 너무 큰 리스크를 부담하는 것이다. 하나의 작은 파일럿 프로젝트로 시작해 성공사례를 만드는 것이 중요하다. 성공 사례 이후 점진적으로 확장하면 된다.
- 프롬프트 튜닝과 프롬프트 엔니지어링의 차이점을 알아라: 기업이 LLM을 도입할 때, 현재 상황과 필요에 맞는 방법을 선택할 수 있어야 하고, 이 차이를 알아야 데이터를 준비해야하는지, 어느정도 수준까지 요구할 수 있는지 알 수 있다.
이 글을 보았지만 여전히 어떻게 AI도입을 준비해야 하는지 감이 잡히지 않는다면 아래 링크를 통해 컨설팅을 받아볼 수 있다.
'PM&Consulting > AI 개념 및 트렌드' 카테고리의 다른 글
AI컨설턴트가 알려주는, 기업이 AI 도입 전에 꼭 알아야 하는 핵심 기술 (2) | 2024.11.27 |
---|---|
AI컨설턴트가 알려주는, 기업이 AI 도입 전에 꼭 알아야 할 내용 (0) | 2024.11.26 |