인공지능은 정말 빠르게 발전하고 있다.만약 내가 2년전에 이 글을 썼다면 머신러닝, 딥러닝에 대한 내용을 작성하면서 데이터가 얼마나 중요한 요소인지 설명하는 글을 적었을 것이다. 지금은 내가 강조하지 않아도 AI를 사용하는데 데이터가 얼마나 중요한지 모두가 알고 있다. 요즘은 머신러닝, 딥러닝보다 LLM을 활용하고자 하는 기업이 엄청 많아졌다. 챗GPT의 등장으로 많은 사람들이 LLM에 대한 접근이 쉬워졌기 때문에 이를 활용하고자 하는 사람들도 많아졌다고 생각한다. 챗GPT를 보면 내가 특별히 어떤 데이터를 주지 않아도 대답을 너무 잘하기 때문에 LLM을 활용하고자 할 때 데이터는 별로 중요한 것 처럼 느껴지지 않는다. 하지만 이전 글을 보면 알 수 있듯이 LLM은 '생성'을 잘하는 머신러닝 모델 중 하..
AI 컨설턴트는 기업이 인공지능(AI)을 도입하고 활용하여 문제를 해결하고, 효율성을 높이며, 새로운 비즈니스 기회를 창출할 수 있도록 돕는 전문가다. 많은 기업들이 AI에 대해 아무것도 모른채 상담문의를 하는게 안타까워 블로그 글을 작성하기 시작했다. AI를 도입하려는 기업이 AI를 구성하는 핵심 기술을 알아야 하는 이유AI는 기업의 효율성과 경쟁력을 강화하는 데 강력한 도구가 될 수 있다. 하지만 AI를 제대로 활용하려면 그 기술이 어떻게 구성되고 작동하는지 기본적으로 이해하는 것이 중요하다. 다음은 그 이유를 설명한다. 1. AI 도입의 현실적 가능성을 평가하기 위해AI 기술의 핵심 요소를 알면, AI가 우리 회사의 문제를 해결할 수 있는지를 현실적으로 평가할 수 있다. 예를 들어, 자연어 처리(N..
AI 컨설턴트는 기업이 인공지능(AI)을 도입하고 활용하여 문제를 해결하고, 효율성을 높이며, 새로운 비즈니스 기회를 창출할 수 있도록 돕는 전문가다. 회사에서 일하다 보면 많은 기업들이 AI 도입에 관심을 가지고 문의를 해온다.그러나 AI에 대해 명확히 이해한 상태에서 접근하는 경우는 드물다.AI는 한 번 제대로 도입하면 기업의 혁신과 경쟁력 강화에 큰 도움이 될 수 있지만, 도입 과정에서 적지 않은 비용과 노력이 필요하다.따라서 기업이 AI를 도입하기 전에 기본 개념과 활용 방안을 정확히 이해하는 것이 중요하다. 이번 글에서는 "AI란 무엇인가?"라는 질문에 답하며, 기업이 AI를 통해 어떤 가치를 얻을 수 있는지, 그리고 도입을 고려할 때 반드시 알아야 할 내용을 쉽고 명확하게 설명하고자 한다. A..
이 포스팅을 작성하게 된 계기지난 포스팅에서 데이터사이언티스트가 기술 컨설턴트의 역할을 하게 되었다고 했는데, 컨설턴트는 생각보다 많은 일들을 하는 직무다.단순히 AI를 필요로 하는 사람들에게 문제를 해결하기 위해서는 어떻게 데이터를 저장하고, 저장한 데이터를 어떻게 활용하여 AI를 만들고, 적용하는지 상담해주는 역할을 할뿐만 아니라 문제 해결을 위해서 만들어야하는 AI의 아키텍쳐 + AI를 이용한 비즈니스적 아키텍쳐도 그릴 수 있어야하고, 큰그림을 그릴 줄 알아야하기 때문에 AI 솔루션을 총괄하는 PM의 역할도 겸하게 되는 경우도 있다. 특히 나처럼 스타트업에서 일하는 경우에는 인력부족으로 다양한 일을 한번에 하게되는데, AI tech consulting을 리드하는 사람으로써 외부 미팅을 나가거나, 홍..
직무가 바뀐 이야기 작년 12월 이후 포스팅을 못하고 있었다. 회사에서 하던 업무가 바뀌었기 때문에 이에 적응하느라 데이터 사이언티스트로써 새로운 기술을 살피고 적용해볼 시간이 없었기 때문이다. 해가 바뀌면서 내가 다니는 작은 스타트업도 조직개편을 시도했다. 사실 회사의 방향성 자체가 바뀐거라 하는 일도 많이 바뀌었다. 지난 12월달에 업로드한 포스팅을 보면 알겠지만, 거대 언어모델이 세상에 나오면서 일반적인 머신러닝, 딥러닝보다는 LLM에 더 관심이 쏠렸고, 이 LLM을 잘 이용할 수 있는 기술인 LangChain을 새롭게 배우면서 그동안 접하지 않았던 NLP에 대한 이해부터 생성형 AI에 대한 알고리즘을 공부하고, LangChain을 적용하기까지 3개월동안 열심히 달렸다. 그리고 나는 AI 개발자에서..
논문을 선정한 이유 요즘 회사에서 LLM, LangChain 관련사업을 많이 하고 있는데, 원래 정형데이터나 CV를 하다가 갑자기 언어모델을 하려고하니 여러가지 부분에서 부족한 느낌을 받으면서 일하고 있었다. LLM의 최신 동향을 알고싶기도 했고, 다른곳에서는 어떻게 LLM을 사용하고 있는지 궁금해서 논문을 읽어보게 되었다. 이번 논문리뷰는 기존에 실습코드를 같이 진행했던 논문리뷰와 다르게 서베이 논문이기 때문에 논문을 잘 요약하여 그 내용을 내것으로 만드는데 중점을 두었다. 논문읽기 서론 LLM이 등장하기 전에는 번역, 요약, 질의응답, 형태소분석 등의 작업이 각각 개별적으로 연구되고 있었으나 GPT와 같은 LLM이 등장한 이후 자연어로 할 수 있는 여러가지 task들이 하나의 LLM모델이 모두 처리할..
오후 3시부터 저녁 9시까지 진행된 랭체인 코리아 밋업은 쉬는시간, 저녁시간 없이 논스톱으로 진행되었다. 각 세션을 들으면서 내가 생각하기에 필기가 필요한 내용 또는 내 생각을 마구잡이로 작성한 포스팅이라 전체적인 내용이 통일성 없이 진행되더라고 감안하고 포스팅을 읽으면 좋을 것 같다. 내 생각은 회색 글자로 표시를 할 예정이라 내용만 쓱 보고 싶다면 검은색 글자만 확인하면 된다. 개인적으로 가장 흥미로웠던 세션은 Autonomous Agent in Production이었다. 내가 지금 하는 업무에 도움이 되었던 세션은 LLM Multi Agent, Enterprise 기업에서 LLM 프로덕션 사용기 정도였다. Session1. 유튭정리에서 데이터 시각화까지 이 부분은 우리 회사에서도 진행이 완료된 부분..
멀티모달이란? 멀티모달을 직역하면 여러개의 모달리티 라는 뜻이다. 멀티 = 여러개 모달 = 모달리티 모달리티는 잘 사용하지 않는 단어여서 사전을 살펴보면 "양식, 양상" 이라는 뜻을 가지고 있는데 AI에서 modality는 "데이터형식" 이라고 생각하면 될 것 같다. 결국 멀티모달AI는 여러개의 데이터 형식을 가지고 수행하는 AI 라는 뜻이다. 지도학습을 기준으로 기존 모델이 작동하는 방식을 보면 한개의 데이터 형식을 input으로 넣어서 학습시켰다. 하지만 멀티모달은 두개 이상의 데이터를 input으로 넣을 수 있다는 얘기인데 예를들면 이미지+텍스트를 input으로 넣거나 이미지+정형을 input으로 넣을 수 있다. 예전에는 영상데이터가 있으면 영상데이터를 한 프레임씩 잘라서 이미지로 변환한 다음 해당..
선행지식: LangChain에 대한 전반적인 흐름, 구조 (prompt, llm model, agents, tools etc...) 논문을 선정한 이유 요즘 랭체인을 공부하고 있는데 그 구성요소 중 하나인 Agent Types에서 가장 기본적으로 사용하는 ZERO_SHOT_REACT_DESCRIPTION에 대해서 확실하게 이해하고 싶었다. 내가 아는 react라고는 프론트엔드에서 사용하는 라이브러리뿐이다....ㅋㅋㅋ 논문읽기 Abstract 저자는 현재의 언어모델이 좋은 성능을 보였지만 "추론"과 "의사결정" 작업의 경우 좀 더 발전할 필요성이 있는것으로 본다. 논문에서는 추론과 의사결정을 잘 작업할 수 있도록 reasoning trace와 task specific actions를 잘 배치하는 방식을 연..
랭체인을 공부하게 된 이유 chat gpt의 상용화로 언어모델에 대한 관심이 높아지면서 자연스럽게 LLM을 공부하고자 하는 마음이 생겼다. 특히 인터넷상에서 검색할 수 있는 것들을 학습하여 어떤 대답이든 척척 내어놓는 모습을 보면서 개인적으로 보유하거나 회사 차원에서 보유하고 있는 데이터를 학습시켜 검색을 한다면 업무의 효율성이 올라갈 것 같았다. 개인적인 데이터를 사용하는 경우에는 오픈소스로 나와있는 언어모델을 호출해서 사용하면 되지만, 회사에서 사용하고자 하는 경우 민감한 데이터의 유출이 이루어지면 안되기 때문에 로컬에서 랭체인을 사용한 챗봇을 만들려면 어떻게 하면 좋을지 궁금해졌다. 이 주제를 시도하게 된 이유 openAI에서 chat gpt를 발표한 이후 많은 사람들의 관심이 Chat으로 넘어가게..