LongCut logo

RAG 어렵다고요? PDF 하나로 5분 만에 시작하는 법 (feat. 공원나연님)

By 빌더 조쉬 Builder Josh

Summary

Topics Covered

  • 그래프 DB는 관계 중심 저장
  • 그래프 레그가 벡터 검색 한계 극복
  • 온톨로지가 AI 추론 기준 제공
  • 그래프 레그가 답변 근거 시각화
  • 에이전트 품질은 데이터 경로 설계

Full Transcript

정치 카테고리의 최신 뉴스 알려줘.

요런 식으로 이제 검색을 하면은 그 주위에 있는 기사들이 연결되어 있었기 때문에 요걸 기반으로 왼쪽에 요런 답변들이 가능한 거죠. 오른쪽처럼

그래프 구조를 활용을 한다면 주위에 있는 맥락들까지 함께 검색이 가능한 거기 때문에 훨씬 설득력 있는 답변이 가능해지는게 그래프 래그의

방식입니다. 이제 PDF 파일을 넣어

방식입니다. 이제 PDF 파일을 넣어 가지고요 코드를 돌리면은 아래처럼 요런 형태의 그래프를이 패키지가 자동으로 추출을 해 주기 때문에 제가 생각했을 때는 그래프 래그를 제가

쓰는 이유는네 >> 구독자 여러분 안녕하세요. 오늘

빌더도 씨 채널에는 유튜버이자 신로 떠오르시는 이제 공원 나연 님을 모시고 레그와 그래프 레그 이런 부분에 대해서 함께 이야기 나눠보는 시간을 가져보고자 합니다. 네. 나현

님 안녕하세요. 반갑습니다.네

>> 안녕하세요 조신 님. 어, 초대해

주셔서 우선 너무 감사드리고요. 어,

저는 소개해 주신 대로 이제 유튜브 공원 나연이라는 채널을 운영하면서 AI, 에이전트나 레그 관련된 특히 그래프 레그 관련된 콘텐츠들을 이제

업로드를 하고 있고요. 또 이제

패스트 캠퍼스라는 곳에서 이제 주로 강의를 하고 있고 혹은 기업이나 기관에서 강의를 하고 있는 강사일을 주로 하고 있습니다. 그리고 이제

프리랜서로 AI 에이전트나 레그 시스템을 이제 개발도 하고 있는 AI 엔지니어로서 지금 현재 일을 하고 있는 중입니다.

>> 아, 네. 어, 너무 정통 AI를 연구하시는 분을 모셔 가지고 정말 큰 영광이고 일단은 그 그래프 데이터베이스, 네오제 일반인들에게는

바로 딱 그 용어를 듣자마자 바로 이해하기는 어렵겠지만 그래도 아, 레그에 좀 친숙하시다라고 생각한다면 그런 분야들을 조금 아실 수가 있는데 지금 하시고 계시는 그런 내용들이

주로 어떻게 되시는지 좀 말씀해 줄 수 있을까요? 어 주로 이제 말씀해

수 있을까요? 어 주로 이제 말씀해 주신 것처럼 그래프 데이터베이스를 어떻게 쓰는지 그리고 요즘 뭐 온톨로지나 그래프 래그라고 하는

키워드가 굉장히 많이 뜨고 있잖아요.

그런 것들을 어느 정도 보시면은 아시겠지만 이제 그래프 레그를 구축을 하려면은 결국에 이제 지식 그래프라는게 있어야 하고 지식

그래프가 만들어지려면은 또 그래프 스키마도 설계해야 하고 뭐 온톨로지도 이제 만들어야 되고 요런 1년의 과정들이 있는데 그런 것들을 이제

말씀해 주신 것처럼 되게 생소한 개념이기도 하고 어 레퍼런스가 제가 봤을 때는 많이 없는 분야이기도 해서 그런 거를 제가 좀 유튜브나 강의를

통해서 좀 쉽게 전달하고자 하는 그런 지식 공유를 하고 있는 사람입니다.

네.

>> 네. 아니, 그게 특이한게 그런 부분들을 보통 글이나 이런 걸로 푸시는 분들이 많은데 유튜브로 하시는 것이 정말 재밌더라고요. 채널을

어떻게 시작하게 되셨는지 배경을 좀 말씀해 주실 수 있을까요? 우선 이제

제가 기술 블로그를 처음 이제 하게 됐는데 그때는 이제 저도 회사를 다니는 입장에서 따로 이제 공부할 내용들이 생기면은 저 제 스스로 좀 정리하는 용도로 그렇게 시작을

했었다가 저도이 유튜버들을 통해서 도움을 많이 받다 보니까 저도 글로만 표현을 하는 것보다 이제 말로

표현했을 때 훨씬 더 이해가 잘되는 것들이 남아 있다라고 생각을 해서 이거를 이제 영상 콘텐츠로 풀어내면 면은 너무 유익한 채널이 될 거

같다. 좀 스스로 그런 생각이 들어서

같다. 좀 스스로 그런 생각이 들어서 유튜브를 시작하게 된 거 같아요.

네.

>> 아, 정말 유용한 내용을 많이 전달해 주셔 가지고 저는 너무 많이 배우고 있고요.이 그래프래그나 랭그래프 이런

있고요.이 그래프래그나 랭그래프 이런 것들을 사실 많은 분들이 잘 모르실 거 같아요. 일단 그래프

거 같아요. 일단 그래프 데이터베이스가 뭔가요? 데이터베이스와

데이터베이스가 뭔가요? 데이터베이스와 어떻게 조금 다른지에 대해서 좀 말씀해 주실 수 있을까요? 어,

우선은 그래프 데이터베이스라고 하는 거는 딱 한 문장으로 좀 정리를 하자면 데이터 안에 이제 관계를 중심으로 저장하는 그래프 데이터베이스거든요. 어, 그냥

데이터베이스거든요. 어, 그냥 일반적으로 저희가 알고 있는 RDB 이제 관계 데이터베이스라는 거랑 >> 음, >> 어, 그래프디 DB가 어떻게 다른지 요걸로 좀 정리를 할 수 있을 것

같아서 이제 왼쪽에 있는게 RDB거든요. 이제 보통은 이제 표

RDB거든요. 이제 보통은 이제 표 테이블들이 이제 이렇게 각각 엔티를 표현하고 있는 형태라서 여기서 관계를

중심으로 저희가 조회를 하려면은 조인 연산들을 통해서 테이블들이 이제 조인 조인 해 가지고 그 정보들을 이제 조회하는게 일반적인데 그래프디라고

하는 거는 여기에서 나타날 수 있는 관계를 아예 이제 이런 화살표 엣지라고 하는 걸로 아예 관계를 처음부터 설계 하면서 저장하는

그래프라서 예를 들어서 어떤 A라고 하는 사람이 어 높은 평점을 준 액션 영화는 뭐냐라고 하는 질문을 하면이 그래프

DB에서는요 관계를 따라서 그냥 길을 찾아서 탐색하듯이 바로 조회를 할 수가 있는 거예요. 그게 가장 큰 특징인 거 같습니다.

>> 아, 저는 이제 오른쪽보다는 왼쪽 화면이 좀 더 익숙하기는 한데 >> 음. 오른쪽은

>> 음. 오른쪽은 표현하는게 어떤 부분에서 효과적인지를 그냥 간단하게라도 말씀드릴 수 있나요? 우선은 여기 이제 왼쪽에서

있나요? 우선은 여기 이제 왼쪽에서 어떤가 어떤 영화에 대해서 평가를 내렸다라고 하는 이제 관계를 조회하려면 테이블 두 개를 가져와

가지고 그만큼 연산하는 시간도 필요하고 요런 조인하는 연산 과정들이 필요한데 이제 사실 그래프로 요렇게 표현을 해 놓으면 사람이 봤을 때

그냥 생각하는 그 과정 그 자체를 직관적으로 표현해 놓은 거거든요.

보시면은 어떤가 상점을 내렸다, 평가를 했다라고 하는 어떻게 보면 사람이 읽었을 때 동사 같은 역할을 하는게 이제 관계로 바로 표현이 돼

있기 때문에 요거를 따로 이제 조인 같은 거 할 필요 없이 어떤가 원하는 그런 요청이나 질문을 바로 관계를

따라서 검색할 수 있다는게 가장 큰 특징일 것 같습니다. 아, 문장과

같이 이게 도식화가 잘 연결이 돼 있다라는 표현이 되게 직관적으로 와닿네요. 그러니까 뭐 유 네임이티드

와닿네요. 그러니까 뭐 유 네임이티드 바이 뭐 레이팅 혹은 네임이드바이 리뷰 이런 식으로 해서이 딱딱 따라가 가지고 그 모든 관계를 추적할 수가

있다. 그리고 그걸 시각화해서 우리가

있다. 그리고 그걸 시각화해서 우리가 이해할 수가 있다라는게 어 쉽게 해석할 수 있는 방법 중에 하나겠네요. 너무 좋습니다. 네,

하나겠네요. 너무 좋습니다. 네,

맞습니다.

>> 네. 아, 너무 쉽게 설명해 주셔서 감사해요. 네. 네. 다음 질문은 어

감사해요. 네. 네. 다음 질문은 어 레그를 저희는 좀 알고 싶은데 레그 그리고 그래프 레그 이게 이제 제가 알기로 나현님의 어떤 전문 분야로 보이거든요. 근데 이거를 어떻게

보이거든요. 근데 이거를 어떻게 우리는 좀 이해할 수가 있을까요?

우선 레그라고 하는 거는 이제 사실이 단어 안에 답이 있거든요. 리트리벌이

검색이란 뜻이고 어그맨티드가 이제 뭔가 검색된 결과를 증강된 그런 정보를 가지고 이제 답변에 이제 세너레이션 생성을 하겠다라는 뜻이라서

이제 대답을 하기 전에 관련 있는 정보를 이제 먼저 검색부터 시켜서 이제 마치 오픈북 시험 보듯이 이제 검색 결과를 미리 가져와서 그 안에서

답을 찾게 하는 방식이라서 [음악] 이제 훨씬 더 답변의 품질도 상승하게 될 거고 당연 술처가 있는 답변이 가능해지는 거고 그만큼 신뢰도가 높은

답변이 가능해지는 겁니다.

>> 그렇죠. 어 그러니까 우리가 단순히 채집비나 재미나이에서 팔로시네이션처럼 나오는게 아니라 정확한 데이터 레퍼런스를 잘 참조해서 나오게끔 할

수 있는 것이 레그다라고 그렇게 우리가 생각할 수 있는 거 같고 제가 좀 약간 궁금한 거는 웹에서 따로 검색을 해 가지고 가져오는 방식과 내부 데이터베이스에서 저장해서

가져오는 방식이 두 가지가 조금 상호 공존하는 거 같아요. 그런데 레그를

일반인 관점에서는 이걸 왜 따로 배워야 되지라고 하는 그런 궁금증이 좀 있을 것 같기는 하거든요.

>> 음. 음, 이제 가장 큰 차이는 웹에서 없는 저만의 데이터가 있다라는게 가장 큰 이유인 것 같아요. 특히 저만 가지고 있는 내부

같아요. 특히 저만 가지고 있는 내부 데이터를 기반으로 답변을 하게끔 하면 제가 가지고 있는이 문서가 내부에 어떤 위치에 있는지도 이제 찾을 수가

있을 거고 제가 직접 그 자료를 어 제 로컬에서 찾지 않아도 그 안에서 알아서 검색해 주는 역할을 또 이제 내부 레그를 통해서 할 수가 있기 때문에 그게 가장 큰 차이가 아닐까

싶습니다.

>> 네. 아, 말씀해 주신 걸로 딱 비유적으로 딱 이해가 되는게 우리가 그 어떤 조직의 산 전문가가 있다고 하면은 그 산 전문가만이 가지고 있는 뭐 컴퓨터 내부에 있는 파일이라든가

본인이 가지고 있는 지식 같은게 있는데 하나의 에이전트를 우리가 만든다고 하면은 그 산문가만이 가지고 있는 예를 들면 안묵지라든가 이런게 있을 거 아니에요. 근데 그런 것들을 언제든지 쉽게 꺼내서 쓸 수 있게끔

해 주는 그런 개념이다라고 이해를 하는게 편하겠네요.

>> 음. 네. 네. 네. 맞습니다.

>> 아, 네. 감사합니다. 그래프 레그는

그러면 레그랑 차이는 어떻게 되나요?

음, 그래프 레그라고 하는 거는 제가 두 가지로 좀 그림을 준비해 봤어요.

왼쪽에 있는게 그냥 벡터 데이터베이스를 기반으로 한 왼쪽에 있는게 그래프 웨그를 하기 위해서 문서를 뭔가 그래프로 표현한

이제 그림인데 왼쪽에 보이시는 것처럼 벡터 데이터베이스를 사용한다는 거는이 문서를 벡터 DB에 저장을 할 때 그 문서가 굉장히 길이가 길다 보니까

텍스트 조각들로 잘라서 보통 저장을 합니다. 이제 파란색이 청크들이

합니다. 이제 파란색이 청크들이 쪼개어서 저장이 되어 있는데 근데 요렇게 저장을 하면 사실 이제 문맥을 다 끊어내고 저장을 하는 거잖아요.

그래서요 전체 맥락들을 확인을 하기에는 좀 한계가 있는 구성인 거죠. 그래서 단순히 벡터 DB를

거죠. 그래서 단순히 벡터 DB를 사용하는게 아니라 오른쪽처럼 그래프 구조를 활용을 한다면요 분홍색 동그라미들이

청크 노드들이거든요.

이제 청크들이 그래프로 표현이 되면이 A라고 하는 청크랑 b라고 하는 청크가 연관이 되어 있다. 요런

관계도 표현을 할 수가 있고 주위에 있는 맥락들까지 함께 검색이 가능한 거기 때문에 훨씬 더 이제 설명력이

좋아질 거고 훨씬 설득력 있는 답변이 가능해지는게이 그래프 구조를 활용하는 그래프 래그의 방식입니다.이 이 청크는 하나의 정보

방식입니다.이 이 청크는 하나의 정보 덩어리들인 것이고 그 정보 덩어리들이 다른 정보 덩어리들과 이제 하나하나씩 연관되어 있는데 주변에 맥락까지 싹다

고려하고 근거 자료까지 제시를 하면 훨씬 설득력을 갖출 수 있다. 그래서

레그라고 하는 기법 자체가 서로 정보를 주고받을 때 훨씬 더 효과적으로 이해를 할 수 있는 좋은 방법 중에 하나다라고 우리가 인식을 하면 되는 것이죠.

>> 네. 네. 맞습니다. 정확합니다.

>> 네.

그렇군요. 저런 맵을 저는 오피시피디언에서 많이 봤거든요.

>> 그 옵시디언과 유사하다고 보면 되는 건가요?

>> 네. 네, 맞습니다. 근데 이제

옵시디언에서도 결국 이제 제가 저장해 놓은 자료와 자료 간의 이제 연관성들을 이제 그래프 형태로 저장해 놓고 직관적으로 확인하기 위해서 어

쓰는 구조를 활용하는 방식이다 보니까 네. 그런 형태랑 비슷하다고 보면 될

네. 그런 형태랑 비슷하다고 보면 될 거 같습니다.

>> 아, 너무 잘 설명해 주셔서 감사합니다. 그러면 그다음에는

감사합니다. 그러면 그다음에는 궁금한게 이제 그래프 레그도 알았고 레그도 딱 이해가 됐어요. 근데이

온톨로지의 중요성이 요즘 많이 부상된다고 말씀해 주셨잖아요. 근데

그 온톨로지가 무엇인지 그거를 어떻게 우리는 설계할 수 있을지에 대해서 좀 간단하게 설명 주실 수 있을까요?

>> 네. 이제 어 온톨로지라고 하는 거는 이제 일상이나 혹은 업무상에서 안묵적으로 이해하고 있는들이나 혹은 매뉴얼 같은 것들이 있을 텐데

그거를 이제 개념적으로 표현하기 위한 영세서 같은 걸로 이해를 할 수 있을 것 같아요. 식 그래프든 표준이 되는

것 같아요. 식 그래프든 표준이 되는 그런 규칙 체계라고 이해를 할 수 있는데 AI가 그걸 잘 이해할 수 있도록 표준을 잡아주는 그런 정의하는

역할을 해 줄 거예요. 사실 제가

예전에 교육 회사에서 일을 했었고 교육에서의 온톨로지를 한번 만들어 보고자 어 시작했던였어요.

그래서 보시면은 이제 교육에서는 보통 어떤 개념과 개념 간의 관계를 표현을 해서요 개념을 배우기 위해서는 이런

개념이 선행되어야 하고 요런 것들을 표현을 하는 지식맵이라는 그런 개념이 있습니다. 관계를 중심으로 표현하는게

있습니다. 관계를 중심으로 표현하는게 필요하기 때문에 그거를 이제 자동화해서 요런 그래프 형태로 입과서에 대한 온톨로지를 자동으로

추출하는 POC를 한 거예요. 어

보면은 개념간의이 연관성들이 쭉 그래프 형태로 표현이 되어 있고 학생들이 어떤 개념에 좀 취약한 개념을 가지고 있는지 요런

것들을 표현한 그래프입니다. 요걸

제가 왜 설명을 드리냐면 이제 온톨로지라고 하는 거는 결국에 추론에 활용하기 위한 그 기준이 되는 역할을

한다라고 어 이해를 할 수 있는데 예를 들어서 어떤 학생이 2차 함수라는 개념이 부족한데 계속 2차

함수에 대한 문제만 주는게 아니라 2차 함수에 선행되어야 하는 뭐 방정식이라는 개념을 온톨로지로서 그

밑단에 규칙 체계 세 개로서 표현을 해 두면 AI는 2차 함수에 대해서 좀 취약한 성취도를 가지는 학생한테 방정식이라는 문제도 같이 추천을 해

줄 수가 있는 겁니다.

>> 아, 우선은이 온톨로지라고 하는게 이거 들으면서 계속 느꼈던게 아, 저도 사실 저는 약간 IT 필드에 있잖아요. 근데

저는 이제 프로덕 디자인이라든가 아니면 PM 일들을 주 해 왔는데 그때 저희는 데이터 분석을 위한 텍소노미 설계라는 걸 합니다. 예를

들면은 메인 페이지가 있고 그 메인 페이지에 관계가 되어 있는 서브 페이지들이 있고 그거 하위에는 어떤 클릭 같은 그런 것들이 좀 있다.

이런 것들을 저희도 나름 이름과 네이밍인 규칙 같은 걸 다 설계해 가지고 그거를 따로이 다 이름 지어서 관계성 같은 것들을 좀 만드는데 아이

작업이 약간 뭐 그런 거랑 좀 비슷한 느낌이 든다. 그러니까 그런 생각이

느낌이 든다. 그러니까 그런 생각이 들어서 말씀해 주신 대로 이제 학습에 있어서는 선행 과정이 있고 후행 과정이 있는데 이런 것들이 연동이 돼

있는 것을 하나하나 우리가 시각화해서 보 보면서 아 내가 뭘 이전에 해야 되고 뭐가 앞으로 부족한지에 대해서 빨리 시각화해서 볼 수가 있다는게 정말 큰 장점인 거 같습니다. 근데

그거를 또 AI가 이렇게 주게 되면은 굉장히 빨리 이해하고 그거를 꺼낼 수가 있다라는 뜻인 것이죠.네 네,

맞습니다. 말씀해 주신 것처럼 그런 텍사놈이라고 하는 이제 분류 체계들이 이제 정리해 놓는 그런 것들도 다 1년에 온톨로지를 설계하는 과정인

거라서 정확히 이해하신 거 같아요.

네.

>> 아, 다행이네요. [웃음]

>> 네. 어, 정말 잘 설명해 주셔서 감사드리고요. 그럼 온톨로지가 일단

감사드리고요. 그럼 온톨로지가 일단 왜 중요하고요? 예, 한 번 더 좀이

왜 중요하고요? 예, 한 번 더 좀이 부분에 대해서 명시적으로 말씀해 주시면 좋겠다는 생각이 들어요.

그래서 이걸 왜 우리가 잘 설계를 해야 다른 데서 어떻게 또 잘 쓰일 수가 있는지에 대해서 좀 말씀해 주실 수도 있을까요?

>> 음. 음, 우선은 사실 앞에서도 말씀드렸듯이 온톨로지라는 건 뭘 하든지간에 AI한테 이제 구조화된 정보를 주기 위해서 정말 기본이 되는

설계 과정인 거여서 특히나 그래프 레그를 구현하려면 지식 그래프가 있어야 하고요 지식 그래프를

만들려면 그래프 스키마라는 걸 설계를 무조건 해야 하는데 요게 온톨로지 설계 과정과 유사하다고 생각을

하거든요. 그래서 결국 온톨로지라는게

하거든요. 그래서 결국 온톨로지라는게 있어야 우리가이 업무상에서 혹은 뭐이 특정 도메인에서 표현하려고 하는

그래프로 이제 표현을 하기 위해서 꼭 필요한 스키마를 설계하는 과정인 거여서요 과정은 어 꼭 필요한 부분이라고 생각합니다.

>> 음. 음, 결국 핵심 뼈대가 제일 중요하다. 이렇게 우리가 해석을 할

중요하다. 이렇게 우리가 해석을 할 수 있을 것 같고. 어, 너무 어, 맞는 말씀 해 주신 거 같습니다.

그다음 개념도 좀 궁금합니다.

랭그래프라고 하는 개념도 있잖아요.

그러니까 이런 것이 무엇인지 그리고 뭐 랭체인이랑 어떤 관계인지 좀 설명해 주실 수 있을까요? 우선은

랭그래프라고 하는 거는 이제 어 이름에 있듯이 이제 그래프 형태를 뭔가 활용하는 거긴 하거든요.

이것도이 랭그래프라는 건 저희가 LLM 어플리케이션 특히 이제 최근에 뭐 AI 에이전트 뭐 에이전틱한 워크플로우 요런 것들을 설계하기

위해서 필요한 프레임워크라고 보시면 됩니다. 그래서 어 저희가 뭐 다양한

됩니다. 그래서 어 저희가 뭐 다양한 에이전트 기능들을 사용을 하면 얘가 질문을 받고 바로 답변을 내놓는게 아니라 사용자의 질문이나 요청을

받았을 때이 사용자가 어떤 질문 의도를 가지고 있는지 분석하는 단계, 분석을 했으면 요걸 가지고 정보를 찾는 단계, 정보를 찾았으면 답변하는

관계. 그 내부적으로 엄청나게 많은

관계. 그 내부적으로 엄청나게 많은 그런 작업 단계들이 필요해요. 그래서

요런 그래프 형태를 표현한 LM 어플리케이션을 만든다는 거는 [음악] 이런 작업 단계를 하나의 노드로 정의를 하고요 노드들이 어떤 순서로

실행이 될 건지를 그래프 형태로 설계해 나가게끔 만들어진 프레임워크가 랭그래프라는 겁니다.

>> 음, 그렇군요. 랭그래프 도구가 제가 알기로 아직 많지는 않았는데 대표적으로는 어떤게 있나요?

랭그래프라고 하는 것을 우리가 잘 만들 수 있는 뭐 잘 시각할 수 있는 그런 뭐 프레임워크가 무엇인지에 대해서 말씀해 주실 수 있을지 궁금합니다.

>> 음. 사실 저는 이제 개발을 하는 입장에서 랭그래프라는 프레임워크를 이제 파이썬으로 코드를 짜서 개발을 한 다음에 저 제가 만든 에이전트가

예쁘게 만들어졌는지 눈으로 봐야 하잖아요. 그런 것들은 이제 랭그래프

하잖아요. 그런 것들은 이제 랭그래프 스튜디오라는 걸 통해서 이제 실행을 해서 어 에이전트가 어떤 흐름으로

이제 작업이 진행되는지 그런 걸 이제 UI 출로 확인은 할 수 있습니다.

>> 아 그렇게 할 수 있군요. 뭔가 어

개발자가 아닌 입장에서 뭔가 그런 것을 딱 접근했을 때 뭔가 무서울 거 같은데 그런 도구가 있다는게 참 다행인 거 같고요. 네. 그러면은

이제 그럼 다음 파트로 한번 넘어가 볼게요. 일반적으로

볼게요. 일반적으로 어 그래프 레그가 많은 부분들을 해결해 주는 것으로 해석이 되는데 그 그래프 구조를 쓰면은 실제로 그

LLM이 답변질를 굉장히 잘 주는 것으로 저는 이해를 하고 있어요.

근데 그게 실제로는 얼마나 달라진다고 볼 수가 있나요? 모델 자체는 동일한 거니까이 모델한테 얼마나 더 풍부한 맥락을 주고 얼마나 정확한 정보를

이제 컨텍스트로서 잘 제공을 할 거냐이 차이가 발생을 하는 건데 예를 들어서 벡터 레그만 쓰면은 그냥 그

질문과 관련된 유사한 페이지 단위로 이제 가져오는 데서 그친다면 그래프 구조로 이제 컨텍스트를 구성을 하게 되면 예를 들어서 어떤 페이지를

찾았을 때이 이 페이지랑 관련 있는 브록에 있는 또 다른 페이지가 있을 수 있잖아요. 그래서 요런 것들을

수 있잖아요. 그래서 요런 것들을 그래프 구도로 같이 이제 연결을 시켜서 저장을 할 수 있고 검색을 할 때도 같이 끌어다 쓸 수 있는 구조다

보니까 llm이 답변을 할 때 한정된 어이 맥락이 끊긴 하나의 청크만 보고 답변을 하는게 아니라 어 얘랑이

연관된 내용들까지 같이 보기 때문에 그래프 레그를 쓰면은이 내용이 어떤 계층적인 적인 구조를 가지고 있고

어떤 다른 문서랑 연관이 있고 요런 것들까지 같이 포함해서 추론을 한 뭔가 답변을 생성할 수 있다는게 답변의 품질 측면에서 체감이 되는

영역일 것 같습니다.

>> 아, 그렇군요. 아, 이해했습니다.

그걸 실제로 지금 표현하신 사례 같은게 혹시 따로 있으세요?

>> 네. 사실 그래프라는 걸 쓰면 당연히 답변의 구조적인 맥락들까지 참고하기 때문에 답변의 성능까지

좋아지는 것도 당연히 맞지만 요렇게 그래프 구조로 답변이 어떤 근거를 가지고 생성이 된 건지를 같이 시각할 수 있다는게 제일 좋은 점인 거

같아요. 그래서 요거는 이제

같아요. 그래서 요거는 이제 유튜브에서 제가 만들었던 그 데모인데 예를 들어서 제가 정치 카테고리의 최신 뉴스 알려줘. 요런 식으로

질문을 하면 이게 얘가 어떤 근거를 가지고 답변한 건지가 눈에 보이는 거예요. 이제 검색을 하면은 그래프가

거예요. 이제 검색을 하면은 그래프가 정치라고 하는 코 카테고리 노드를 중심으로 그 주위에 있는 기사들이

연결되어 있었기 때문에요 기사 열 가지 정도를 이제 최신 뉴스로 검색을 했다라는게 바로 이제 우측 시각화로

보이는 거고 요걸 기반으로 왼쪽에 요런 답변들이 가능한 거죠. 요렇게

최신 뉴스들을 요걸 근거로 답변했다라는게 어 눈으로 보이는 좀 뭔가 설득력을 높여 줄 수 있는 그런 방안으로 그래프 구조를 활용하면 좋은 거 같습니다.

>> 저 카테고리 안에 저렇게 다 연결이 돼 있는데 그러면 저 세부 노드들 그러니까 지금 마우스에서 바로 위에 기사를 눌러 주시겠어요?

>> 네네.

>> 네. 그래서 그 거기서 파생되는 다른 그 외부 노드들이 있잖아요.

>> 걔네들은 연관이 예, 맞아요. 연관이

있는 거예요, 없는 거예요?

>> 아, 연관 있습니다. 얘는 뉴스 기사 노드고 이거는 또 컨텐트라는 노드거든요.

>> 요거는요 뉴스 기사가 실제로 어떤 내용을 가지고 있는지를 제가 텍스트 청크로 잘라서 노드로 따로 쪼개 놓은 거예요.

>> 음. 음.

>> 그래서 요거는 왜 있냐면 이제 나중에 그래프 래그 하려면 결국에 벡터 검색으로 의미 기반으로 이제 검색을 하려면 요런 것들로 검색을 해서

만약에 내용의 요게 나왔다 하면은이 내용이 어떤 뉴스 기사고 얘는 또 어떤 카테고리 가지고 있고 요런 연결된 정보를 활용하기 위해서 다 연결을 시켜 놓은 겁니다.

>> 아 그냥 단순히 그냥 정보 청크 단위군요. 하나의 기사 안에 여러

단위군요. 하나의 기사 안에 여러 가지 내용들이 있으니까 그거를 좀 잘라 놓은 거다. 이렇게요.

>> 아, 이했습니다. 주셔서 감사합니다.

네. 이렇게 레그를 표시하면은요.

어떤 산업군에 주로 쓰게 되나요?

>> 음. 저는 주로 어, 제조 분야를 좀 말씀드릴 수 있을 것 같은데 이제 >> 제조요. 네. 네네.

>> 제조요. 네. 네네.

>> 왜요? [웃음]

제조에서 이제 되게 뭐 공정 과정에서 발생하는 로그 데이터들이 많잖아요.

>> 근데 요거를 이제 보통 엔지니어 분들이 이제 고장 이력 같은 거를 조회하는데 어떤 증상이 발생했고이 증상에 어떤

원인이 있고 요런 것들을 이제 찾아내서 엔지니어링에 활용을 하신대요. 그래서 요거를 활용할 때

하신대요. 그래서 요거를 활용할 때 그래프 구조를 활용하면은 어떤 고장 설비에 어떤 부위에 어떤

증상들이 발생했고요 증상에는 어떤 원인이 있고요 원인은 또 어떤 해결 방법을 가지고 있고 요렇게 연결되는 어네 그런 측면에서 이제 제조

분야에서도 요즘 특히 뭐 스마트 팩토리 하면서이 지식 그래프를 많이들 활용을 하려고 하시는 거 같아요.

확 이해가 되네요. 뭔가 그 공정 과정에 만약에 에이전트와 에이전트끼리의 어떤 워크플로우를 이어주는 그 하나의 로그가 된다고 하면은 그 로그 안에서 뭔가 문제가

있다고 하면은 그걸 잘 반라내야 되는 일이 아직 그 에이전트 설계에 있어서 조금 숙제로 저는 인식이 되고 있었어요.

>> 음. 음.

>> 근데 그런 거를 그래프 레로 풀게 되면은 훨씬 더 잘 발견을 할 수가 있고 직관적으로 판단이 되겠다라는 생각이 지금 딱 들었었어요. 어,

너무너무 어, 잘 배웠고 너무너무 감사한 거 같아요. 초적인 질문 좀 드리고 싶은게 나현님의 관점에서는 좋은 에이전트는 무엇이고 그 품질을 높이는 방법이 무엇인지가 좀

궁금하더라고요. 제가 생각했을 때는

궁금하더라고요. 제가 생각했을 때는 데이터의 품질을 높이면 에이전트의 품질이나 채봇의 품질도 자연스럽게 올라간다라고 이제 계속 실험을 하고

거기에 초점을 맞추는 사람이어서 그래프 래그를 제가 쓰는 이유는이 에이전트가 결국 정확한

답변이나 또 정확한 그런 의사 결정 혹은 추론 같은 것들을 잘하기 위해서는 전달되는 정보가 제일 중요하고 이걸 그걸 잘 전달하기

위해서 저는 그래프를 쓰는 거여서 에이전트가 생각을 잘하게끔 경로를 잘 닦아 주는게 중요하다고 생각해요.

그래서 이제 그래프 구조에서 요런 관계들을 계속 표현해서 또 그래프 레그에서도 쓰는 검색 방식도 되게 다양하거든요.

그래서 그래프 래그를 위한 에이전트라고 하면은 또 사용자의 요청에 따라서 어떤 검색 방식을 써야 되고 어떤 식으로 관련된 정보를

찾아야 하고 그래프는 어느 범위까지 가져와서 쓸 거고이 데이터를 결국 잘 가져오기 위한 방법론들을 좀 잘

설계하는게 제일 중요한 거 같아요.

>> 너무 네. 잘 설명해 주셔서 감사드리고요. 네. 저는 그런 생각이

감사드리고요. 네. 저는 그런 생각이 드네요. 그러니까 요즘 사실 AI가

드네요. 그러니까 요즘 사실 AI가 너무 많은 걸 굉장히 잘 해 주는 시대잖아요. 사실은 그죠. 많은

시대잖아요. 사실은 그죠. 많은

것들을 저는 거의 지금 판단까지 맡기고 있긴 하거든요. 거의 어느

정도는. [웃음] 근데 그런 설계조차 AI가 할 수 있지 않을까는 생각은 드는데 혹시 그런데 나현 님께서 어떤 생각을 갖고 계신가요? 맞아요.

저희는 이제 에이전트를 정말 나 대신 일할이 AI로 이제 계속 자동화를 하는데 쓰게 되잖아요. 그런 맥락에서

쓰게 되잖아요. 그런 맥락에서 처음에 말한 온톨로지라는게 또 중요한 이유도 내가 안묵적으로 알고 있는 걸

AI도 똑같이 알고 있어야 이게 가능한거다 보니까 연결 정보들을 그래프나 온톨로지로 표현하는 것

자체가 되게 중요하고이 싱크를 맞추기 위해서 필요한 작업인 거 같아요.

>> 그렇군요. 그래프 레그라고 하는 분야 자체도 뜬다라고 느껴지는 이유는 인간이 가지고 있는 어떤 뇌구조의 정보 탐색 구조라든가 이런 것들을 되게 담게끔 만들고 싶어 하는 인간의

의지도 좀 있는 거 같고 그리고 어 말씀드신 대로 뭔가 초개인화가 되게 진행이 되고 있거든요. 회사들이 요즘

사스를 안 써요. 자기가 다 만들어서 쓰거든요. 근데이 그래프 레그와 그게

쓰거든요. 근데이 그래프 레그와 그게 그 양상이 어떻게 연결이 되느냐라고 했었을 때 제 생각은 어쨌든 이걸 쓴다는 용도 자체가이 한 조직과 한

개개인의 안묵지나 이런 것들을 잘 해석해서 정확한 내용으로 어 검색과 작업을 수행할 수 있게끔 만들어 주는데 있어서 그 효용이 있다라는데

있어서 그 개인화라는 부분과 굉장히 많이 맞물리는듯한 느낌이 드는 거 같아요. 그럼 실전적으로 랩브레이크를

같아요. 그럼 실전적으로 랩브레이크를 처음에 시작을 하고자 하시는 분들 위해서는 뭘 가장 먼저 해야 될까요?

어, 제가 생각했을 때는요 그래프가 사실 좀 낯설 수 있잖아요. 그래서요

그래프랑 일단 친해지는게 제일 필요한 거 같고 어, 요거 제가 좀 추천드리고 싶은 사이트가 있거든요.

네오포제에서 제공하는요 그래프를 직접 그려 볼 수 있는 사이트예요. 에로스.앱이라고 앱이라고

사이트예요. 에로스.앱이라고 앱이라고

하는 화살표 모양을 가진요 엣지를 의미하는 뜻인데 >> 아, >> 네. 요런 식으로 노드를 직접 저희가

>> 네. 요런 식으로 노드를 직접 저희가 만들어 볼 수 있어요. 예를 들면은

저희가 머릿속으로 가지고 있는 뭐 생각이던 뭐 자동화하고 싶은 업무들이 있을 건데 그걸 그냥 무작정 그래프로 그려 보시는 걸 추천드려요. 조쉬라고

하고 여기에서 요렇게 당기면은 노드를 하나 만들 수 있고 >> 오쉽네요.

>> 예. 그렇죠. 이게 되게 요렇게 빌더 조씨라는 채널을 뭐 운영을 하고 있고 운영을 한다 뭐 요런 식으로 그래프를

생각나는 대로 그냥 그려 보면은 요게 어떤 형태로 머릿속에 있는 걸 좀 정리하는 용도로 많이 쓸 수 있을 것 같아서 요거 >> 마인드맵처럼 생각할 수 있네요. 네.

>> 맞아요. 네. 그런 걸로 이제 직관적으로 >> 쓸 수 있는 사이트라서 요런 걸로 한번 그래프로

여러분들이 가지고 있는 데이터 요런 것들을 표현해 보는게 필요한 거 같습니다. 그래프 레그라고 하는 거

같습니다. 그래프 레그라고 하는 거 자체를 그 예를 들면 우리 회사만의 특화된 어떤 에이전트를 만들고 싶어라고 한다고 하면은 에로 사이트를

열고 우리가 그냥 브레인스토밍 하듯이 저렇게 한번 우리 생각을 쫙 한번 펼쳐보고 우리는 어떤 관계적인 에이전트를 만들고 싶은가에 대한 정의를 저 세션에서 해 볼 수가 있겠네요.

>> 맞아요. 맞아요.

>> 아 재밌네요. 근데 저거를 또 우리가 에이전트 화를 시킨다든가 아니면 다르게 표현하려면 어떻게 해야 되나요? 그다음에 델프 레고레스에

되나요? 그다음에 델프 레고레스에 활용도 하고 그다음에 이제 저희 회사만의 에이전트래도 만들려고 한다고 하면은 우린는 어떻게 하면 좋을지 >> 이거를 어 아예 사이퍼 언어로 추출도

가능하거든요. 요걸 이제 추출해

가능하거든요. 요걸 이제 추출해 가지고 바로 그래프 d비에다가 넣어서 적재된 형태의 그런 지식 그래프를 한번 살펴 보기도 하면서 그래프

레그는 결국 이런 요청과 질문 중심으로 이루어지니까 어떤 시나리오로 이제 에이전트를 굴릴 수 있을지 그런 것들을 좀 반영하면서 계속 이런

그래프 형태의 지식 그래프를 설계해 보는게 먼저 필요할 것 같습니다. 저

정도까지는 비개발자도 되게 쉽게 잘할 수 있을 것 같은데 근데 만약에 비개발자로서 그다음 스텝 그러니깐 어 저걸 가지고 그래프 레그를 표현을

실제로 하려면 어떤 도구가 필요하고 뭘 해야 되나요? 저는 주로

네오포제라는 그래프 DB를 쓰고요 네오포제의 그래프 레그 패키지라는게 있어요. 요게 네오4제비에서

있어요. 요게 네오4제비에서 만든 그래프 레그를 쉽게 구현할 수 있도록 모듈화시켜 놓은 패키지인데

요거를 쓰면은 뭐 처음에 그냥 문서를 넣어 가지고요 문서를 그래프로 자동으로 추출해서 네오4포제에 이제 넣어 보는 그런 것까지 이제

올인원으로 해 볼 수가 있고 요거 >> 아 문서를 아무거나 넣으면 자동으로 추출을 해 줘요.

>> 네. 보통 이제 PDF 문서 같은 것들 넣으면은 요거를 지식 그래프로 표현을 해 볼 수가 있거든요.

>> 아, 그렇구나. 아, 네. 너무

편하다. 네. 그래서 그런 것들 사실 이게 문서는 다 코드 중심이긴 해요.요 코드 한 줄로 저희가 PDF

해요.요 코드 한 줄로 저희가 PDF 문서를 지식 그래프로 변환해 주는 거거든요. 이제 PDF 파일을 넣어

거거든요. 이제 PDF 파일을 넣어 가지고요 코드를 돌리면은 아래처럼 요런 형태의 그래프를이 패키지가 자동으로 추출을 해 주기

때문에 처음에 문서를 어떻게 변환할지 모르겠다 하시면은 요걸로 한번 바로 돌려 보시는 것도 좋을 거 같아요.

>> 음. 너무 좋네요. 너무 좋네요.

네. 저렇게 해서 지식 관계 같은 것들을 내가 볼 수 있고 데이터베이스 같은 것도 볼 수 있고 >> 맞습니다. 그

>> 맞습니다. 그 >> 용도가 딱 명확한 거 같아요. 지금

저렇게 하는 것은 AI에게 훨씬 더 어 좋은 답변 퀄리티로 넣을 수 있는 방법 중에 하나이기 때문에 어 저 방법을 우리가 한번 선택을 해서 하면 넘으면 좋을 것 같습니다. 이제

그러면은 어 이제 최근에 이런 내용들을 나현님께 더 전문적으로 배울 수 있는 강의를 오픈하셨다고 하는데 어떤 강의인지 간단하게 소개해 주실 수 있을까요?

아, 맞아요. 제가 어, 최근에 패스트 캠퍼스라는 곳에서 그래프 레그의 모든 것이라는 이름으로 강의를 런칭을 했습니다. 어, 커리큘럼 잠깐

런칭을 했습니다. 어, 커리큘럼 잠깐 보여 드리면은 처음에 이제 그래프네 >> d비를 어떻게 사용하는지 그 사용법부터 시작을 할 거고요.

그래서요 그래프에 이제 원하는 정보를 결국 검색하기 위해서는 쿼리 언어가 필요하고 이제 RDB에서 SQL 쓰듯이 그래프에서는 사이퍼라는 쿼리

언어를 쓰게 돼요. 그래서 그 사이퍼 쿼리를 또 어떻게 작성하는지 정말 기초적인 것부터 처음에 다루게 될 거고 그리고

이제 저희가 원하는 건 그래프로 표현하고 싶은 거잖아요. 그래서 어떤

식으로 이제 모델링을 할 수 있고 어떻게 변환을 하는 그런 흐름들을 가질 수 있는지를 처음부터 이제 실습을 중심으로 진행을 하게 될 거

같습니다. 그리고 그렇게 구축한 지식

같습니다. 그리고 그렇게 구축한 지식 그래프 기반으로 그래프 레그를 만들어 보면서 실제로 거기서 원하는 답변을 어떤 방식으로 얻을 수 있는지도

실습을 할 거고요. 그리고 그래프

레그가 잘 [음악] 만들어졌는지, 내가 원하는 답변을 잘 해 주는지 평가도 해보면서 실제로 평가가 되게 중요하거든요. 레그 만들고 그냥 끝이

중요하거든요. 레그 만들고 그냥 끝이 아니라 원하는 답변이 나와야 쓸 만한 레그가 되는 거라서 그런 평가하는 것도 좀 보여 드리고 마지막에는

앞에서 제가 보여 드렸던 그런 데모를 여러분들이 또 직접 만들어 보는 이제 정말 올인원 강의로 봐 주시면 될 거 같습니다.

>> 아, 네. [웃음]

저 저는 지금 사실 내가 어떤 목적으로 어떻게 이걸 들어야 될까에 대해서 저는 사실 생각을 해 본 적이 없었는데 오늘 나현 님이 이렇게 한시간 정도 대화를 쭉 하다 보니까

어 나한테 무조건 필요하다라는 생각이 확 드는 거 같아요. 그래서 너무 예 듣고 싶다는 생각이 들고 이거 보시는 분들께 할인코드 같은 거 주시면 너무 감사할 것 같은데 뭐 혹시 그런 거 있나요?네

있나요?네 >> 있습니다. 제가

>> 있습니다. 제가 >> 아 그래요?네 네. 제가 사실 이제 조씨 님 채널 나온다고 백캠에 말을 해뒀거든요. 이게 너무 좋은 기회이다

해뒀거든요. 이게 너무 좋은 기회이다 보니까 이제 백캠에서 조씨 빌더 조씨 채널의 구독자분들을 위한 쿠폰을

발급을 해 주신다고 해서 그거는 제가 따로 전달드리도록 하겠습니다.

>> 아, 감사합니다. 네. 아, 여러분들

횡제하셨습니다. 여기까지 오셔서.

네. 이거 끝까지 봐주셔서 정말 감사드리고요. 아, 주로 그 어떤

감사드리고요. 아, 주로 그 어떤 분들이 강의를 수강하기 원하시는지를 말씀해 주시면 감사할 것 같아요.

어, 주로 이제 요거는 입문자분들도 충분히들을 수 있도록 이제 그래프나 온톨로지나 뭐 그래프 레그에 대해서 처음 들으시거나 이제 막 시도하려는

분들께 정말 적합할 거 같기도 하고요. 그리고 이제 벡터 레그까지는

하고요. 그리고 이제 벡터 레그까지는 만들어 봤지만 요거를 뭐 실제 성능을 좀 기대하기가 어려웠다. 그래프

래그라는 걸로 좀 품질을 고도화시키고 싶다 하시는 분들께도 이제 실무자 분들께도 충분히 추천드릴 수 있을 것 같습니다. 왜냐면 에이전트까지 또

같습니다. 왜냐면 에이전트까지 또 다루는 강의다 보니까 어 그래프에 관해서 정말 폭넓게 활용하고 싶으신 분들께 모두 추천을 드립니다.

>> 아 알겠습니다. 정말 너무 배우고 싶다라는 생각하게 됐고요. 어 한시간

동안 정말 이게 충실히 설명해 주신 부분 정말 감사드리고요. 어

마지막으로 하고 싶은 말씀이 혹시 있으신지 궁금합니다.

>> 어 우선은 정말 초대해 주신 조씨님께 너무 감사드리고요. 이게 제 처음에는

너무 감사드리고요. 이게 제 처음에는 많이 그래프에 대해서 낯설 수 있지만 좀 많은 분들이 좀 그래프라는 구조에

재미를 붙이고 다양한 도메인에 도전해 볼 수 있는 재밌는 분야라고 생각해서 오늘이 팟캐스트를 통해서 좋은 의사 결정이나

좀 더 설득력 있는 그런 시스템을 구축을 할 수 있도록 어 그런 계기가 되었으면 좋겠고요. 저도 앞으로 이제

되었으면 좋겠고요. 저도 앞으로 이제 유튜브 채널이나 강의를 통해서 더 좋은 콘텐츠로 계속 공유를 해 드릴 수 있는 그런 지식 공유자가 될 수

있도록 노력하겠습니다. 많은 관심

있도록 노력하겠습니다. 많은 관심 부탁드립니다.

>> 네. 아, 고맙습니다. 이렇게 해서

지금 오늘 공원 나연 님이랑 같이 이제 그래프 레그와 이제 레그의 기초적인 개념 그리고 그래프 레그를 어떻게 시각화해서 할 수 있는지에 대한 기초 등을 같이 이야기 나눠봤습니다. 오늘 되게 유용하셨을

나눠봤습니다. 오늘 되게 유용하셨을 것이라고 생각이 들고요. 공원님

채널을 꼭 구독해 주시길 바라겠고요.

어, 저희는 또 다음에 또 저 연사님 모시고 또 함께 하도록 하겠습니다.

네. 오늘 너무 수고 많으셨습니다.

고맙습니다. 내 님.

>> 네. 고생 많으셨습니다. 감사합니다.

>> 네. 감사합니다. 네. 님.

감사합니다.

Loading...

Loading video analysis...