AI로 같은 프롬프트로 같은 캐릭터 묘사했는데 다른애가 나온다.
같은 재료에 같은 주제 던져도 그리는 사람이 여러명이면 각자 다른 그림이 나오는 것과 비슷하다.
AI는 주사위를 굴리면서 그림을 그린다(확률적 샘플링)
게임같은거 보면 맵을 생성할 때 시드라는 것을 사용한다.
AI도 생성할 때 랜덤값으로 주사위 굴리듯이 매번 연산에서 다른 결과를 내놓는데
"빨간 머리 소녀" 하나만으로
긴 빨간 머리에 파란 눈
짧은 빨간 머리에 갈색 눈
곱슬 빨간 머리에 초록 눈
과 같이 다양한 바리에이션이 튀어나오는 것을 알 수 있다.
1, 0로 대화하는 애한테 말로 개떡같이 설명하기(텍스트-이미지 매핑 한계)
AI에게 "김윤교"라는 사람을 설명해보자면
"긴머리, 남성, 한국인..."
빨간 머리 소녀를 생각해보자 바리에이션은 충분히 나온다.
사람 얼굴은 정말 복잡하다.(얼굴/자세 변형)
마찬가지로 확률적 샘플링에 의해 미세하지만 얼굴이나 자세의 비율이 달라지는 경우가 생긴다.
우리가 거울로 보는 내 얼굴과 사진으로 보는 내 얼굴 사이에 괴리감이 크듯이
변화의 수치는 작을지언정 결과적으로는 마치 생소한 사람처럼 느껴지기도 한다.
뭣이 중헌디(장기 기억 부족)
AI가 기억할 수 있는 내용은 한계가 있다.
내용이 점점 길어질수록 AI는 필요하다고 판단되는 정보만 선택해서 기억하려 한다.
나만의 완벽한 캐릭터를 만들기 위해 수천자의 디테일한 프롬프트를 박아넣어보자
"금발에파란눈에멋지고아름답고미사여구를1000자를박아넣은....."
이제 대화 10번만 더 해보자
AI는 대답할것이다.
"금발에 파란눈 OK"
당신의 완벽한 캐릭터? 1000개의 바리에이션으로 쪼개질 것이다.
[신분증을 준비해주세요] "나를 모르느냐"(고유 ID 없음)
일론머스크를 그려달라 하자
학습된 데이터에는 "이사람 누구? 일론머스크"가 성립할 수 있다.
"금발에파란눈에멋...아 이름은 조나단이야"
"조나단 그려줘"
