컴퓨터가 시를 쓰기 시작한 날: AI 시의 역사

AI & Poem을 만들면서 저는 자연스럽게 한 가지 질문에 빠져들었습니다. "컴퓨터가 시를 쓴다는 발상은 대체 언제부터 있었을까?" 대부분의 사람은 AI 시 생성기를 최근 몇 년 사이에 등장한 새로운 기술로 생각합니다. 그러나 컴퓨터에게 창작을 맡기려는 시도는 컴퓨터 자체의 역사만큼이나 오래되었습니다. 최초의 상업용 컴퓨터가 등장하자마자, 선구적인 연구자들은 이미 기계에게 글을 쓰게 하는 실험을 시작했습니다.

이 글에서는 1950년대의 원시적 텍스트 생성 실험부터 오늘날 수억 명이 사용하는 AI 시 생성기까지, 약 70년에 걸친 여정을 연대기순으로 살펴봅니다. 이 역사를 이해하면, 현재의 AI 시 기술이 어디에서 왔고 어디로 향하고 있는지를 더 깊이 통찰할 수 있습니다.

1950~60년대: 최초의 컴퓨터 시 실험

컴퓨터가 문학적 텍스트를 생성한 최초의 사례는 1952년으로 거슬러 올라갑니다. 영국의 컴퓨터 과학자 크리스토퍼 스트레이치(Christopher Strachey)는 맨체스터 대학교의 페란티 마크 I(Ferranti Mark I) 컴퓨터에서 '러브레터 생성기(Love Letter Generator)'를 개발했습니다. 이 프로그램은 미리 저장된 명사, 동사, 형용사 목록에서 단어를 무작위로 조합하여 연애 편지를 만들어냈습니다.

스트레이치의 러브레터는 오늘날의 기준으로 보면 원시적이었습니다. "My dear darling, you are my avid fancy"처럼 문법적으로는 맞지만 의미적으로는 어색한 문장들이 생성되었습니다. 그러나 이것은 획기적인 사건이었습니다. 기계가 인간의 감정적 표현을 흉내 낼 수 있다는 가능성을 처음으로 보여주었기 때문입니다. 스트레이치 자신은 이 프로그램을 유머러스한 실험으로 여겼지만, 후대의 연구자들은 이를 컴퓨터 창작의 공식적인 시발점으로 평가합니다.

1960년대에는 독일의 막스 벤제(Max Bense)와 테오 루츠(Theo Lutz)가 '확률적 텍스트(Stochastische Texte)'를 실험했습니다. 루츠는 카프카의 소설에서 추출한 단어 목록을 확률적으로 조합하여 새로운 문장을 생성했습니다. 이 시도는 컴퓨터 시의 '결합 방식(combinatorial approach)' — 미리 정해진 요소를 규칙에 따라 조합하는 방식 — 의 초기 형태를 보여줍니다.

1990~2000년대: 규칙 기반에서 통계 모델로

1984년, 윌리엄 챔벌린(William Chamberlain)과 토마스 에터(Thomas Etter)가 개발한 RACTER는 최초로 인공지능이 쓴 책으로 출판된 'The Policeman's Beard is Half Constructed'를 생성했습니다. RACTER는 복잡한 문법 규칙과 단어 데이터베이스를 사용하여 산문과 시를 생성했습니다. 결과물은 초현실적이고 종종 무의미했지만, 대중에게 '기계가 글을 쓴다'는 개념을 처음으로 각인시킨 사건이었습니다.

1990년대 후반부터 2000년대에 걸쳐 자연어 처리(NLP) 기술이 급속히 발전하면서, 시 생성 방식도 변화했습니다. 규칙 기반 방식에서 통계적 언어 모델로의 전환이 일어난 것입니다. 이 시기의 시 생성 시스템은 n-gram 모델을 사용하여 말뭉치(corpus)에서 단어의 출현 확률을 계산하고, 이를 기반으로 새로운 텍스트를 생성했습니다. 결과물의 품질은 아직 제한적이었지만, 기계가 '패턴을 학습한다'는 개념적 전환은 이후 혁명의 씨앗이 되었습니다.

이 시기에 주목할 만한 프로젝트는 MIT 미디어랩의 몇몇 실험과, 시인이자 프로그래머인 닉 몬포트(Nick Montfort)의 작업입니다. 몬포트는 컴퓨터 시를 '전자문학(electronic literature)'이라는 새로운 문학 장르로 자리매김하려 했으며, 코드 자체를 시적 표현의 도구로 사용하는 작품을 발표했습니다.

또한 이 시기에는 시적 텍스트의 '운율 분석(scansion)'을 자동화하려는 시도도 등장했습니다. 영어 시의 강세 패턴, 프랑스어 시의 음절 수, 일본어 하이쿠의 음절 구조를 컴퓨터가 인식하고 분석하는 연구가 진행되었습니다. 이러한 분석 도구들은 직접적으로 시를 생성하지는 않았지만, 각 언어의 시적 규칙을 형식화하는 데 기여했으며, 이후 AI 시 생성기가 언어별 시적 전통을 학습하는 데 중요한 기초 자료가 되었습니다. 규칙의 이해가 창작의 기반이 된 셈입니다.

2017년 트랜스포머의 등장과 패러다임 전환

2017년은 AI 시의 역사에서 가장 중요한 해입니다. 구글 연구팀이 발표한 트랜스포머(Transformer) 아키텍처가 자연어 처리의 모든 것을 바꿔놓았기 때문입니다. AI가 시를 쓰는 원리: 기술과 감성의 만남에서 자세히 설명했듯이, 트랜스포머의 셀프 어텐션(Self-Attention) 메커니즘은 텍스트의 모든 부분 간의 관계를 동시에 파악할 수 있게 했습니다.

이 기술적 혁신이 시 생성에 미친 영향은 근본적이었습니다. 이전의 순차적 모델(RNN, LSTM)은 긴 문맥을 기억하지 못하는 한계가 있었습니다. 시의 첫 행에서 사용한 이미지가 마지막 행과 호응해야 하는데, 이전 모델은 이를 안정적으로 구현할 수 없었습니다. 트랜스포머는 이 문제를 해결하여, 처음으로 시 전체의 일관성을 유지하면서 창작하는 것이 가능해졌습니다.

2018년부터 등장한 BERT, GPT 시리즈는 트랜스포머를 기반으로 수십억 개의 텍스트를 학습한 대규모 모델들입니다. 특히 GPT-2(2019년)가 생성한 텍스트의 품질은 많은 사람을 놀라게 했습니다. OpenAI는 GPT-2의 텍스트 생성 능력이 악용될 것을 우려하여 처음에는 전체 모델 공개를 보류하기까지 했는데, 이는 AI 텍스트 생성 기술이 가진 잠재력과 위험성을 동시에 보여준 사건이었습니다. 비록 시 전문 모델은 아니었지만, GPT-2가 생성한 시적 텍스트는 인간이 쓴 것과 구분하기 어려운 수준에 처음으로 도달했습니다.

2020년대: GPT와 대중화된 AI 시 생성

2020년 GPT-3의 등장은 AI 시 생성의 대중화를 촉발했습니다. 1,750억 개의 매개변수를 가진 이 모델은 시, 소설, 에세이 등 거의 모든 형태의 텍스트를 인간에 가까운 수준으로 생성할 수 있었습니다. 이전까지 AI 시는 연구실의 실험에 머물러 있었지만, GPT-3의 API 공개와 함께 누구나 AI 시를 생성할 수 있는 시대가 열렸습니다.

AI & Poem도 바로 이 시대의 산물입니다. 저희는 GPT 계열의 대규모 언어 모델을 기반으로, 시 생성에 특화된 프롬프트 엔지니어링과 후처리 시스템을 결합하여 서비스를 구축했습니다. 32개 언어에 대해 각각의 시적 전통을 반영한 맞춤 프롬프트를 설계하고, 콘텐츠 필터링으로 안전성을 확보했습니다.

2020년대 중반에 이르러 AI 시 생성기는 일상적인 도구가 되었습니다. 결혼식 축사, 생일 축하 메시지, 감정 표현, 교육 자료 — AI 시가 활용되는 영역은 계속 확장되고 있습니다. 동시에 AI 시의 문학적 가치, 저작권 문제, 인간 창작과의 경계에 대한 논의도 활발해졌습니다. AI 시 생성기의 미래: 작가를 대체할까?에서 이 논의를 더 깊이 다루고 있습니다.

이 시기의 또 다른 중요한 발전은 '프롬프트 엔지니어링(prompt engineering)'의 등장입니다. 동일한 AI 모델이라도 어떤 지시를 어떻게 전달하느냐에 따라 결과물의 품질이 극적으로 달라진다는 사실이 밝혀지면서, 프롬프트 설계 자체가 하나의 전문 분야로 자리 잡았습니다. AI & Poem에서도 32개 언어 각각에 대해 해당 언어의 시적 전통, 운율 체계, 문화적 맥락을 반영한 전용 프롬프트를 설계하고 반복 실험을 통해 최적화했습니다. 사용자가 하나의 주제어만 입력해도 풍부한 시가 생성되는 이면에는, 수백 번의 프롬프트 실험과 미세 조정이 자리하고 있습니다.

역사가 알려주는 AI 시의 다음 단계

70년의 역사를 돌아보면, AI 시의 발전은 세 가지 큰 흐름을 따라왔습니다. 첫째, 규칙 기반에서 학습 기반으로의 전환. 초기의 단어 목록 조합에서 통계적 패턴 학습으로, 다시 심층 신경망의 맥락 이해로 발전해 왔습니다. 둘째, 양의 확대. 수십 개의 단어 목록에서 수억 편의 텍스트 학습으로, 참조할 수 있는 언어 데이터의 규모가 기하급수적으로 커졌습니다. 셋째, 접근성의 민주화. 대학 연구실의 전유물에서 누구나 스마트폰으로 사용할 수 있는 서비스로 변모했습니다.

이 세 가지 흐름이 수렴하는 지점에서 AI 시의 다음 단계를 예측할 수 있습니다. 향후 AI 시 생성기는 사용자의 감정 상태를 실시간으로 감지하여 맞춤형 시를 제공하고, 특정 시인의 스타일을 정교하게 재현하며, 시각과 청각을 결합한 멀티모달 시적 경험을 만들어낼 것입니다. 음성 인식과 결합하면, 사용자가 자신의 감정을 말로 표현하면 AI가 즉석에서 시로 변환해주는 것도 가능해질 것입니다.

스트레이치의 러브레터 생성기에서 AI & Poem까지, 컴퓨터와 시의 관계는 단 한 번도 멈추지 않고 발전해 왔습니다. 이 긴 역사가 우리에게 알려주는 것은, 기계를 통한 창작이라는 꿈은 기술의 한계에 의해 지연되었을 뿐, 결코 포기된 적이 없다는 사실입니다. 그리고 오늘, 그 꿈은 그 어느 때보다 현실에 가까워져 있습니다.

이 역사를 되돌아보면서 한 가지 더 주목할 점은, 기술의 발전이 인간의 시적 표현을 대체한 것이 아니라 오히려 새로운 표현의 가능성을 열어왔다는 사실입니다. 1950년대의 무작위 조합이 컴퓨터 시의 개념을 탄생시켰고, 1990년대의 통계 모델이 패턴 기반 창작의 씨앗을 뿌렸으며, 2010년대의 딥러닝이 맥락을 이해하는 시를 가능하게 했습니다. 각 단계에서 기술은 인간이 상상하지 못했던 창작의 영역을 개척했습니다. AI & Poem을 운영하면서 매일 확인하는 것은, 사용자들이 AI 시를 통해 자신의 감정을 새롭게 발견하고, 시라는 매체에 처음으로 관심을 갖게 되는 모습입니다. 기술의 역사는 결국 인간이 자신을 표현하는 새로운 방법을 찾아온 역사이기도 합니다.