
엔씨소프트가 14일, 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 AI 대화 데이터 FoCus Dataset(For Customized conversation dataset)을 공개했다.
FoCus Dataset은 사용자 개인의 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋이다. 8,000여 개의 주제를 다룬 1만 5,000개 이상의 대화로 구성되어 있다.
이 데이터셋을 적용한 AI는 대화하는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고, 위키피디아에서 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화를 이어갈 수 있다.
특히, 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능하다. 현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용이 소요됨에도 불구하고, 실시간 지식과 개인 경험을 반영하는데 한계를 나타내고 있다.
공동연구팀은 지난 2월 세계 최고 권위 인공지능 학회 AAAI 2022에서 해당 연구 논문을 게재 및 발표했다. 오는 10월에는 세계 전산언어학회인 COLING 2022에서 고려대와 공동으로 데이터 활용 경진대회를 비롯한 연구 성과를 공유하는 워크샵을 개최한다.
엔씨 이연수 랭귀지(Language) AI Lab 실장은 "최근 NLP 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정하였으며, 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이루어지기를 기대한다"고 설명했다.
이 기사가 마음에 드셨다면 공유해 주세요

초심을 잃지 말자. 하나하나 꼼꼼하게.risell@gamemeca.com
- [포토] 코스어를 데려오랬더니 '진짜'를 꺼내온 데이브
- 검열 반대, GoG 성인게임 무료 배포에 100만 명 참가
- 일기당천이 되살아난다, 진·삼국무쌍 리마스터 발표
- 네오플노조, 8월 1일부터 '주 5일 전면 파업' 돌입한다
- 니케 손가락 이슈, 유형석 디렉터 "제대로 검수 못했다"
- 풀 HD로, 페이트/할로우 아타락시아 리마스터 7일 출시
- 9월에 몰린 게임 기대작, 8월은 쉬어가는 달?
- "카드사의 스팀 검열 거부한다" 서명 19만 명 참여
- [오늘의 스팀] “바퀴벌레가 나와요!” 그라운디드 2 화제
- 차이나조이에서 확인한 '제 2의 검은 신화 오공'
게임일정
2025년
08월
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|