정말 오랜만에 쓰는 글.. 마지막 글을 쓰고 1년 반이 흘렀습니다.
정신 없이 사는 동안 정말 많은 위기와 기회와 결과가 제 곁을 지나간 듯 합니다.
아주 가끔 이 블로그에 들어와 제가 남겼던 글들을 읽을 때면 그때의 독기와 노력들이 안쓰럽기도 하면서 이제는 추억할 일이 되어버린 것 같기도 합니다.
어린 시절의 나태를 속죄하고자 전역하고 이를 악물고 살았었는데, 그나마 그 덕에 제가 누리고 있는 것들이 참 많은 듯 합니다.
지난 시간동안 많은 고민과 도전을 했고 최종적으로는 올해 3월 계약학과 대학원에 진학했습니다.
부족한 탓에 많은 기회를 놓쳤고, 또 한 편으로는 운이 좋게 계약학과 입시에서는 제가 걸어온 길에 대해 조금의 인정을 받은 것 같습니다.
얼마 전에는 정말 운 좋게도 탑 컨퍼런스에 논문 submission을 해볼 수 있었습니다.

아직 accept되기엔 많이 부족하지만 목표를 두고 달려오는 그 과정 자체를 많이 즐겼던 것 같습니다. 새벽까지 코드 짜고, 실험을 하고 논문을 쓰고 이를 악물때도 그냥 제가 15년 전에 꿈꿨던 그런 사람이 된 듯 해서 지쳐도 할 수 있었던 것 같습니다.
아키텍처 설계에서 정말 많이 헤매고, 이미 했던 실험들을 다 버리고 다시 하고, 논문을 지우고 다시 쓰는 등.. 정말 많은 어려움이 있었습니다.
그러나 많은 것을 느끼고 배운 듯 합니다.
또 다시 이 글을 보러 올 미래의 저를 위해 그동안 연구하며 알게 된 소중한 경험들과 느낀 점들, 그리고 앞으로 어떻게 살아갈지에 대한 생각을 정리해보고자 합니다.
AI의 강화학습을 바라보며..
강화학습은 쉽게 말해서는 AI가 어떤 특정한 기술을 학습할 때 실패와 성공으로부터 배워서 그 기술의 expert가 될 때 까지 그 과정을 반복하는 것입니다.
놀랍게도 이는 사람들이 전문가가 되는 과정과 매우 유사하다고 생각했습니다.
AI는 무수한 시도를 통해 실패와 성공에서 힌트를 얻고 더 나은 시도를 해나갑니다.
처음에는 아무 의미가 없어 보이는 시도가 반복되어 AI가 기술을 완전히 학습하도록 만들어줍니다.
여러 시도 중에 어쩌다가 한 번 운 좋게 나아간 방향이 좋은 결과를 내면 AI는 앞으로 그 방향으로 나아갑니다.
시간이 오래 걸리더라도 학습의 방향성(Reward function)이 올바르다면 끝내 학습을 합니다.
인생도 마찬가지라는 생각을 했습니다.
도전할 수 있는 시간과 운의 확률 분포는 모두에게 공평합니다.
그렇기에 오래도록 많은 시간을 고민하고 먼저 많은 시도를 해본 사람이 당연하게도 더 뛰어난 실력을 가질 수 있는 듯 합니다.
저는 이걸 너무 늦게 알았는지 모르겠으나,
뛰어난 Expert가 되기 위해서는 목표를 향한 무수한 시도를 하는 것은 당연한 것이고,
어떤 방향성을 갖고 나아갈지 결정하는 것이 매우 중요하다는 생각을 했습니다.
그렇다면 저는 어떤 방향성을 가지고 살아야 할까요?
앞으로 10년, 20년 후에는 어떤 시대가 찾아오게 될까요?
지난 22년 말 GPT가 등장하고, 시대가 정말 빠르게 바뀌고 있습니다.
모든 사람이 공통된 전 세계, 전 분야의 지식을 학습한 지적 함수 “y=F(x)”를 가지게 되었습니다.
인간은 이제 F에 궁금한 것을 입력값 x로 넣고, 그에 대해 어떤 도움이 될 수 있는 답을 출력으로 y를 얻습니다.
이 때문에 저는 인간의 “학습”에 대한 목적을 다시 생각해야 할 필요가 있다고 생각합니다.
예전에는 단순히 어떤 분야의 지식을 공부하고, 이것을 실제로 활용하는 업무를 하여 출력 y를 내기 위해서 학습을 했다면, 이제는, 마치 세상의 모든 정보가 저장된 거대한 도서관에서 어떤 책을 꺼낼지 잘 요청하기 위해 학습을 해야 합니다.
즉, x를 잘 작성하기 위해서 공부를 하는 것입니다. 물론 y를 잘 해석하는 것도요.
아는만큼 보인다를 넘어서, 아는 만큼 얻는다라고 할까요.
저는 이제 어떤 전문가가 y를 도출하는 작업에 대해 AI를 이기는 것은 시간이 지날수록 더 어려워 질 것이라고 생각합니다.
F는 지금 이 순간에도 세계에서 가장 뛰어난 연구자들에 의해 다양한 방법으로 발전하고 있습니다.
이것은 우리의 삶을 이미 바꿔 놓았듯, 앞으로 엄청난 변화를 불러올 것 입니다.
이제는 x를 어떻게 작성해서 내가 원하는 y를 얻어낼까? 라는 고민을 하는 시간이 더 중요해졌습니다.
이제 진짜 Expert는 문제를 해결하기 위해 본인의 창의력과 지식을 녹인 x를 F에 입력할 수 있는 사람이라고 생각합니다.
LLM 성능의 saturation?
지난 GPT5 출시 성능에 의문감을 가지는 사람이 많은 듯 합니다.
저도 지난 GPT 버전 출시 당시 충격적인 성능에 비해 혁신의 정도가 줄어들었다고 느끼긴 했습니다.
더 이상 이 F의 혁명적 발전이 이제는 한계가 왔다는 인식이 점점 탑 연구자들 사이에서 지배적인 인식이 되어가고 있지만, 그럼에도 이미 F는 그 효용을 다하고 있습니다.
한 해에 나오는 AI 관련 논문 편수만 봐도 정말 말이 안되는 수가 제출되고 있습니다.
수많은 연구자들이 이전과 차원이 다른 속도로 연구를 하고 있습니다.
본인의 아이디어와 지식이 있으면 그 결과물을 과거보다 더 빨리, 더 높은 퀄리티로 만들 수 있습니다.
이 연구들은 다시 F의 성능을 끌어올리는데 사용될 것 입니다.
F가 정체 된다 해도 연구자들은 또 다른 방법을 찾을 것 입니다.
앞으로 이 양성 피드백은 어떤 결과를 가져올까요?
향후 10년, 아니 이미?
AI가 한 명의 뛰어난 인간의 생산성을 극단적으로 높여서 한 명이 매우 많은 일을 할 수 있게 되는 시대가 오고 있는 것 같습니다.
무언가 명령을 받고 결과물을 내는 일의 대부분은 AI도 할 수 있습니다.
심지어 앞으로 더더욱 잘할 것 입니다.
지금까지 알던 세상에서 먹히는 규칙대로, 남들이 하는 것 처럼 커리어를 준비한다면, 쉽지 않을 것이라고 생각이 듭니다.
Physical AI
최근 휴머노이드나 사족 보행 로봇 분야에서 등장한 VLA 기반 연구들과 그 결과물은 매우 놀랍습니다.
자연어가 로봇과 소통하는 인터페이스가 되어, 우리가 어떤 코드나 실행 버튼 없이 말로 요청할 수 있습니다.
GPT와 같은 LLM은 이미지와 프롬프트에 의해 적절한 출력, 이미지 생성 등을 수행했다면, VLA는 이걸 확장하여 시각과 자연어 입력에 의해 로봇의 동작을 수행합니다.
로봇은 인간과 동일하게 세계에 대한 지식을 기반으로 스스로 사고하고 계획하고 실행합니다.
저는 이것이 굉장한 mainstream이 될 것이라고 생각하는데, 이제 점점 인간의 육체적 노동을 대체할 것 입니다.
여기서도 마찬가지로 명령대로 수행하면 되는 대부분의 업무는 점점 인간 고용의 필요가 없어집니다.
앞으로 이 분야에서도 더 충격적인 기술들이 나올 것이라고 생각합니다.
하드웨어의 단가도 떨어지고, 처리 속도나 유연성도 올라간다면 어떤 세상이 오게 될까요.
노동을 통해 돈을 버는 행위가 대다수에게 남아있을 수 있을까요?
신자본주의(?)
저는 본인의 사업을 운영하거나, 정말 AI대체가 불가한 일부 직종 또는, AI 운용보다 인건비가 더 싼 직종(일을 하기 위해 인건비가 내려쳐지는 현상이 있을 것이라고 생각) 외에는 일을 하지 않는 시대가 올 것이라고 생각합니다.
우리는 이러한 시대를 정말로 머지않아 보게 될 것입니다.
일을 할 수 없는 사람들은 소비를 위한 최소한의 기본 소득을 보장 받을 것입니다.
무엇이 더 좋은 쪽인지는 모르겠습니다.
본인이 추구하는 가치관에 따라 다르겠지요.
그래도 저는 선택의 기회를 준다면 저의 역량을 기반으로 무언가를 하고 싶다는 생각을 합니다.
안주하지 않고 이를 더 악물고 해야 할 듯 합니다.
누군가는 저주받은 세대라고 하지만, 본인이 마음먹으면 무엇이든 할 수 있는 시대라고 생각합니다.
저도 그 안에서 스스로 기회를 만들어 가야 할 듯 합니다.
인공물에 대한 탐구
이번 연구를 하면서 특히 느낀 점입니다.
몇 년 전까지의 과학은 자연현상을 설명하고, 공학은 과학을 기반으로 우리 삶에 편의를 주는 무언가를 설계하는 것이었습니다.
이 때까지만 해도 공학은 우리가 이해하는 것에 대한 결과물이었습니다.
공학의 산출물은 인류의 과학과 수학에 대한 이해 범위 내에서 작동했습니다.
그러나 오늘날 공학자들이 만들어내는 것 중에는 그 원리를 분석할 수 없는 것들이 생겨나고 있습니다.
우리가 사용하는 AI는 어떤 확률 분포 속에서 유의미한 결과를 만들어내는, 결정론적(deterministic) 해석이 불가능한 산출물입니다.
이제는 인류가 자연에 대한 해석이 아닌, 인류가 만들어 낸 인공물의 행동을 해석하기 위해 연구를 수행하고 있습니다.
LLM과 같은 거대 AI 모델에서 나타나는 문제와 그 원인에 대한 가설을 세우고 검증하는 연구가 꽤나 진행되고 있습니다.
마치 오래 전 원자 구조를 추측하던 것처럼 말입니다.
이 점이 정말 재미있는 부분입니다.
앞으로 인류는 예측 불가능하지만, 더 뛰어난 AI를 만들어 나갈 것 입니다.
우리는 그것의 행동을 어떻게 분석하고 통제할 수 있을까요.
우리는 이것을 두려워해야 할까요. 아니면 더 뛰어난 인류가 될까요.
전문가분들이 보기에는 한참 부족한 인사이트일거라 생각하지만,
앞으로 한동안은 이 생각들을 베이스로 살아가볼까 합니다.
다음 연구 방향도 연휴동안 조금 생각을 해봐야 할 것 같습니다.
그럼 다음에 올 때까지.. 또 힘내길.
'Original' 카테고리의 다른 글
| LLM은 이미 정답을 알고 있다. 가장 중요한 건 필요한 지식을 꺼내 쓸 방법 - Poetiq AI (2) | 2025.11.28 |
|---|