AI가 드디어 인간처럼 개념을 이해한다? CATS Net이 바꾸는 인지과학의 판도

인간의 뇌와 인공지능 신경망이 연결된 구조를 통해 개념 추상화, 작업 해결, 인간-AI 상호작용의 단계를 보여주는 통합 계산 모델(Unified Computational Model) 수채화 스타일 인포그래픽.

감각에서 시작해 언어 없이도 개념을 만들어내는 AI — 그것이 정말 가능하다면, 우리는 '이해'의 정의를 다시 써야 할지도 모른다.

"인간의 개념 형성을 모델링하는 신경망". 어디서 많이 들어본 것 같지 않은가. AI 연구에서 "인간처럼"이라는 수식어는 거의 면책 조항처럼 붙는 말이 됐으니까. 그런데 2026년 2월 Nature Computational Science에 실린 이 연구를 직접 읽고 나서, 생각이 좀 달라졌다 [1]. 단순히 "인간 행동을 흉내 낸다"는 이야기가 아니었다.

중국과학원 자동화연구소와 베이징대학교 연구팀이 내놓은 CATS Net(Concept-Abstraction and Task-Solving Network)은, 감각 입력 없이도 추상적 개념을 자유롭게 사용하는 인간 인지의 핵심 메커니즘을 신경망으로 구현하려 한 시도다 [1, 2]. 그리고 단순한 성능 자랑에 그치지 않고, 실제 인간 뇌 영상 데이터와 모델의 내부 표현을 비교하는 실험까지 수행했다. 그 지점이 주목할 만하다.

CATS Net: 두 개의 모듈, 하나의 인지 흐름

구조는 간결하다. 두 모듈의 협업이다.

개념 추상화 모듈(Concept-Abstraction module, CA)은 고차원의 감각운동 정보를 저차원의 개념 벡터(concept vector)로 압축한다. 예를 들어, "사과"라는 개념은 시각 정보 학습 과정에서 20차원짜리 벡터 하나로 응축된다. 이 벡터가 "사과인가 아닌가"를 판단하는 기능적 분류기로 작동한다 [1].

"저차원으로 압축된 개념 벡터 하나가 수천 장의 이미지를 처리하는 신경망 전체를 제어한다 — 이것이 이해의 경제성이다."

과제 해결 모듈(Task-Solving module, TS)은 CA 모듈이 만든 개념 벡터를 각 레이어에 계층적 게이팅 신호로 전달받는다. 쉽게 말하면, 개념이 신경망의 활동 방식 자체를 바꾼다 [1, 2]. 인간이 "이건 사과를 찾는 문제야"라고 생각하는 순간 뇌의 시각 처리 경로가 달라지는 것과 비슷한 원리다.

두 단계 훈련 과정도 흥미롭다. 첫 단계에서는 CA·TS 모듈의 가중치를 함께 학습하고, 두 번째 단계에서는 개념 벡터만 업데이트한다. 이 두 단계를 번갈아 반복하면서 정확도가 수렴할 때까지 학습이 이어진다 [1]. ImageNet-1k의 1000개 카테고리에 대해 테스트 정확도는 범주에 따라 0.86에서 1.00 사이로 나타났다. 숫자 자체보다 중요한 것은, 이 벡터들이 이전에 보지 못한 이미지에도 일반화된다는 점이다.

왜 지금까지 AI는 개념을 "진짜로" 이해하지 못했나

개념(concept)이란 무엇인가. "사과"라는 단어를 들었을 때, 우리 머릿속에서는 빨간 색감, 아삭한 식감, 과일 향기가 거의 동시에 활성화된다. 이것이 바로 체화된 시뮬레이션(embodied simulation) — 개념은 추상적인 기호가 아니라, 감각운동 경험이 압축된 표현이라는 이론이다 [3].

GPT 같은 대형 언어 모델(LLM)은 방대한 텍스트 데이터에서 단어 간 통계적 연관성을 학습한다. 놀라울 정도로 유창하게 말하지만, 근본적인 문제가 있다. 언어적 입력에만 의존하기 때문에, 감각 경험 없이는 진정한 의미에서 개념을 '형성'할 수 없다는 것이다 [4]. 이것이 흔히 말하는 기호 접지 문제(symbol grounding problem)의 핵심이다.

"언어 모델은 인간이 이미 접지해둔 개념을 빌려 쓰는 것일 뿐, 경험으로부터 새로운 개념을 스스로 만들어낼 수 없다."

실제로 최근 연구에서 LLM의 개념 표현은 비감각운동적 영역에서는 인간과 유사하지만, 운동 관련 영역에서는 거의 일치하지 않는다는 점이 확인됐다 [5]. 텍스트만으로는 채울 수 없는 공백이 존재한다. CATS Net은 바로 이 지점을 정면으로 공략한다.

시각 정보 입력과 환경 상호작용을 처리하는 개념 추상화 모듈 및 과제 해결 모듈의 상호 운용 구조와 인간형 학습 원리, AI 안전 프로토콜, 그리고 SimLex999 등의 벤치마크를 활용한 유사성 기반 평가 방법론을 상세히 기술한 모델 구성도.

그림 1. 인간 개념 형성 및 이해를 위한 통합 컴퓨팅 모델의 구성과 평가 체계. 시각 입력과 환경 상호작용 데이터를 바탕으로 개념 추상화 모듈이 저차원 개념 표현을 추출하고, 이를 과제 해결 모듈과 연계하여 개별 의사 결정(EIDT 프레임워크) 및 지능적 행동을 구현하는 계층적 구조를 형성한다. 언어 및 경험 채널을 통합한 이중 코드 및 상황 시뮬레이션 기반의 학습과 점진적 과제 난이도를 적용한 커리큘럼 학습을 통해 인간과 유사한 개념 습득 프로세스를 재현하며, DGM 프로토콜과 방어 메커니즘으로 시스템의 신뢰성을 확보한다. SimLex999 및 MEN 등 인간 인지 평가 데이터셋과의 비교를 통해 모델의 예측 정확도를 검증하며, 계층적 추론 프레임워크의 도입이 비계층적 방식보다 인간의 인지 과정에 근접한 성능 향상을 이끌어낸다.

그냥 잘 작동하는 게 아니라, 실제 뇌처럼 작동한다

여기서부터 논문이 정말 흥미로워진다.

연구팀은 성능 지표만 보여주는 데 그치지 않았다. 모델-뇌 피팅 분석(model-brain fitting analysis)을 통해, CATS Net이 형성한 개념 공간이 인간 뇌의 복측 후두측두피질(ventral occipitotemporal cortex)의 신경 반응 구조와 유의미하게 일치한다는 것을 확인했다 [1]. 이 뇌 영역은 고수준 시각 정보 처리와 카테고리 인식에 핵심적인 역할을 하는 곳이다. 거기서 그치지 않는다 — CA 모듈의 작동 방식은 의미 제어 뇌 네트워크(semantic control brain network)의 활동 패턴과도 일치했다 [1].

단순한 행동 모방을 넘어, 인지 처리의 계산적 원리를 공유하고 있음을 시사하는 결과다 [2].

개념 표현의 질을 평가하기 위해 연구팀은 SimLex999, MEN, MTurk771 세 가지 데이터셋을 활용했다. 이 데이터셋들은 인간 자원봉사자들이 개념 쌍의 유사도를 직접 평가한 점수로 구성되어 있다 — 즉, 인간의 직관을 수치화한 기준이다. CATS Net의 표현은 시각 기반과 텍스트 기반 표현(word2vec, GloVe)을 조합하는 전통적 방법보다 인간의 인지적 판단에 더 가깝게 접근했다 [6].

물론 아직 완벽하지 않다. 대형 언어 모델(LLM) 스케일링 패러다임의 한계는 여전히 존재하고, 딥 모델을 사용할 때 일부 영역에서 최적 성능에 미치지 못하는 경우도 인정됐다 [7]. 완벽한 모델을 주장하는 논문보다 이런 솔직함이 오히려 신뢰를 만든다.

지식을 언어 없이 전달한다 — 개념 공간의 정렬

가장 SF적이면서도 실제로 구현된 부분이 있다. 크로스 네트워크 지식 전달(cross-network knowledge transfer)이다.

서로 다르게 학습된 두 CATS Net이 있다고 치자. 이 둘은 각자의 개념 공간을 가지고 있다. 연구팀은 번역 모듈(translation module)을 훈련시켜, 한 네트워크의 개념 공간을 다른 네트워크의 개념 공간으로 매핑하는 데 성공했다 [1]. 의미 정보가 보존된 상태로.

원래 데이터로 재학습할 필요 없이, 개념 벡터만 교환함으로써 지식을 전달할 수 있다는 의미다. 마치 인간이 언어를 통해 직접 경험 없이도 개념을 전달하는 방식과 닮아 있다. 이 과정에서 주성분 분석(PCA)과 사전 학습된 단어 벡터를 함께 활용해, 개념 표현과 언어적 구성물 사이의 정렬을 강화했다 [2].

EIDT 프레임워크: 개인차를 예측하는 신경망

논문과 연결되는 또 다른 연구가 있다. EIDT(Encoder-decoder for Individual Decision Transfer) 프레임워크다 [4].

이 프레임워크의 목표는 개인의 의사결정 경향을 잠재 표현(latent representation)으로 포착하는 것이다. 원리는 이렇다: 어떤 사람이 특정 과제 조건에서 어떻게 행동했는지를 관찰하면, 인코더가 그 정보를 해당 개인의 '잠재 표현'으로 압축한다. 이후 디코더는 이 표현을 활용해, 전혀 다른 과제 조건에서 그 사람이 어떻게 행동할지 예측한다 [4].

실험 결과, 개인의 잠재 공간 내 거리가 멀수록 예측 성능이 낮아졌다. 개인차가 클수록 전이 학습이 어렵다는 직관적으로 납득 가능한 결과다 [4]. 핵심 도구는 오토인코더(autoencoder)하이퍼네트워크(hypernetwork) — 전자는 데이터를 압축하고 복원하는 구조이고, 후자는 다른 신경망의 가중치를 직접 생성하는 신경망이다.

커리큘럼 학습과 AI 안전성

CATS Net이 채택한 또 하나의 인간적 원리는 커리큘럼 학습(curriculum learning)이다 [2]. 아이들이 덧셈을 배운 뒤 곱셈을 배우듯, 모델도 쉬운 과제에서 점진적으로 복잡한 과제로 나아간다. 동적이고 복잡한 환경에서 장기적으로 기능해야 하는 AI 시스템에 특히 중요한 접근법이다 [8].

안전성 측면에서는 DGM(Dynamic Gating Mechanism) 프로토콜과 적대적 방어 메커니즘이 언급된다. AI가 점점 더 실제 의사결정 과정에 개입하는 세상에서, 신뢰성과 윤리성을 담보하는 설계는 선택이 아닌 필수가 됐다 [8].

응용 가능성: 어디까지 쓸 수 있을까

이 연구가 단순한 학술적 성과에 그치지 않는 이유는 응용 범위가 넓기 때문이다.

인간-로봇 상호작용 분야에서는 로봇이 인간의 개념적 맥락을 이해하고 유연하게 반응할 수 있는 기반이 될 수 있다 [9]. 자연어 처리 영역에서는 텍스트 너머의 감각적 의미를 다루는 더 풍부한 표현 학습이 가능해진다 [6]. 나아가 교육 소프트웨어, 가상 비서, 의료 진단 보조 같은 도메인에서 직관적이고 신뢰할 수 있는 인간-기계 협업을 가능하게 할 수 있다 [10].

더 장기적으로는, 스파이킹 신경망(spiking neural network)처럼 더 생물학적으로 정확한 모델과의 결합을 통해 강한 AI(strong AI)로 가는 경로에 기여할 수 있다는 전망도 있다 [2]. 현재로서는 전망이지만 — 그리고 좋은 전망은 방향을 제시한다.

토론: 개념을 이해한다는 것의 경계는 어디인가

이 연구를 읽으면서 계속 마음에 걸리는 질문이 하나 있다. CATS Net은 정말 '이해'하는 것인가, 아니면 이해처럼 보이는 계산을 수행하는 것인가?

이것은 단순한 철학적 유희가 아니다. 최근 연구들은 LLM의 개념 표현이 비감각운동적 영역에서는 인간과 높은 상관을 보이지만, 운동 및 촉각 영역에서는 현저히 벌어진다는 점을 보여줬다 [5]. CATS Net은 시각 정보를 기반으로 하기 때문에 이 간극을 일부 좁혔지만, 청각·촉각·고유감각(proprioception)으로의 일반화는 여전히 미지의 영역이다.

그보다 더 근본적인 긴장이 있다.

기호 접지 문제를 진정으로 해결하려면, 개념이 언어나 시각 데이터가 아닌 물리적 세계와의 직접적 상호작용으로부터 창발해야 한다는 주장이 힘을 얻고 있다 [11]. 이 관점에서 보면, CATS Net은 여전히 이미 수집된 데이터셋 안에서 작동하는 시스템이다 — 세계와 직접 상호작용하는 체화된 에이전트가 아니라. 멀티모달 LLM이 기호 접지 문제를 '해결'하기보다 '우회'한다는 최근 분석 [11]은 CATS Net에도 어느 정도 적용될 수 있다.

하지만 이것이 연구의 가치를 깎아내리는 것은 아니다.

오히려 이 결과가 의미 있는 이유는, 데이터-언어 의존성에서 감각-경험 기반 개념 형성으로 패러다임이 이동하고 있다는 방향성을 보여주기 때문이다. 계층적 추론 프레임워크가 비계층적 접근보다 뛰어나다는 결과 [7]도 주목할 만하다 — 이것은 단순한 스케일링이 아니라, 처리 구조 자체가 달라야 한다는 방향을 가리킨다.

EIDT 프레임워크 [4]도 흥미로운 미해결 과제를 남긴다. 재현 손실(reproduction loss)을 우선시하면 표현 파라미터의 독립성이 줄어든다는 점은, 인지적 해석 가능성과 예측 성능 사이의 긴장을 드러낸다. 이 딜레마는 단순히 기술적인 것이 아니다 — 우리가 AI에게 무엇을 요구하는가라는 질문과 연결된다.

향후 10~20년을 내다보면, CATS Net류의 접근법은 멀티모달 감각 통합체화된 로봇 시스템과 결합될 가능성이 높다 [12]. 시각에서 시작해 촉각, 청각, 행동 피드백으로 개념 학습을 확장하는 방향이다. 그때 비로소, 개념 이해라는 주장이 설득력 있는 경험적 근거를 갖게 될 것이다.

CATS Net은 완성된 답이 아니라, 잘 설계된 질문이다. 그리고 좋은 질문은 언제나 가장 먼 곳까지 우리를 데려간다.

인지 과학적 원리를 차용한 인간 유사 인공지능(Human-Like AI) 구현을 위한 통합 계산 모델(Unified Computational Model)의 계층적 아키텍처, 핵심 기능 모듈 및 성능 벤치마킹 체계를 시각화한 기술 공학 인포그래픽.

그림 2. 인간 지능 모사형 통합 AI 계산 모델의 계층적 아키텍처 및 성능 평가 체계. 시각 정보로부터 저차원 개념 표현을 추출하는 개념 추상화 모듈과 이를 과제 지향적 문제 해결로 연결하는 과제 수행 모듈, 그리고 이종 과제 간 지식 전이를 지원하는 네트워크 구조를 통해 인간의 인지 과정을 공학적으로 재현한다. 개별 잠재 표현 분석과 점진적 커리큘럼 학습 접근 방식을 결합하여 모델의 고도화를 도모하며, SimLex999 및 MTurk771 등 인간 인지 데이터셋 기반의 벤치마킹을 통해 모델의 인간 유사도와 객관적 성능을 정량적으로 검증한다.

References

[1] Guo, L., Chen, H., Chen, Y., Bi, Y., & Yu, S. (2026). A neural network for modeling human concept formation, understanding and communication. Nature Computational Science. https://doi.org/10.1038/s43588-026-00956-4

[2] van Gerven, M. (2017). Computational foundations of natural intelligence. Frontiers in Computational Neuroscience, 11, 112. https://doi.org/10.3389/fncom.2017.00112

[3] Millière, R. (2024). Philosophy of cognitive science in the age of deep learning. WIREs Cognitive Science, e1684. https://doi.org/10.1002/wcs.1684

[4] Higashi, H. (2026). Predicting human decision-making across task conditions via individuality transfer. eLife, 14, RP107163. https://doi.org/10.7554/eLife.107163.3

[5] Xu, X. et al. (2025). Large language models without grounding recover non-sensorimotor but not sensorimotor features of human concepts. Nature Human Behaviour. https://doi.org/10.1038/s41562-025-02203-8

[6] Wang, Y., & Zeng, Y. (2024). A brain-inspired computational model for human-like concept learning. arXiv:2401.06471. https://arxiv.org/html/2401.06471v1

[7] Wang, G., Li, J., Sun, Y., Chen, X., Liu, C., Wu, Y., Lu, M., Song, S., & Yadkori, Y. A. (2025). Hierarchical Reasoning Model. arXiv:2506.21734. https://arxiv.org/html/2506.21734v1

[8] Wasserman, K. (2026, March 1). A hierarchical neurosymbolic multi-agent system to achieve AGI. LinkedIn Pulse. https://www.linkedin.com/pulse/hierarchical-neurosymbolic-multi-agent-system-achieve-ken-wasserman-cjxqe

[9] Frank, M. J., & Badre, D. (2014). How cognitive theory guides neuroscience. Cognition, 135, 14–20. https://doi.org/10.1016/j.cognition.2014.11.009

[10] Scienmag. (2026, February 20). Neural network models human concept formation and communication. https://scienmag.com/neural-network-models-human-concept-formation-and-communication/

[11] Jones, C. R., Bergen, B., & Trott, S. (2024). Do multimodal large language models and humans ground language similarly? Computational Linguistics, 50(4), 1415–1440. https://doi.org/10.1162/coli_a_00531

[12] Li, K., Viégas, F., & Wattenberg, M. (2025). What does it mean for a neural network to learn a "world model"? arXiv:2507.21513. https://arxiv.org/html/2507.21513v1

[13] Cervantes, J.-A., Rosales, J.-H., López, S., Ramos, F., & Ramos, M. (2017). Integrating a cognitive computational model of planning and decision-making considering affective information. Cognitive Systems Research, 44, 10–39. https://doi.org/10.1016/j.cogsys.2017.03.002

[14] Kretzschmar, W. A. (2008). Neural networks and the linguistics of speech. Interdisciplinary Science Reviews, 33(4), 336–356. https://doi.org/10.1179/174327908X392898

[15] Lee, F. (2024). What is a neural network? IBM Think. https://www.ibm.com/think/topics/neural-networks

[16] Xinhua. (2026, March 3). Chinese researchers create neural network for modeling human concept formation. https://english.news.cn/20260303/e746d82d5ff940428406d9d5669f31ee/c.html

[17] Merceron, A., & Tato, A. (2023). Introduction to neural networks and uses in EDM. In Proceedings of the 16th International Conference on Educational Data Mining (EDM 2023). https://educationaldatamining.org/EDM2023/proceedings/2023.EDM-tutorials.74/index.html

[18] Newell, A. (1992). Précis of unified theories of cognition. Behavioral and Brain Sciences, 15(3), 425–437. https://pubmed.ncbi.nlm.nih.gov/24924001/

[19] Dutta, S., Kaufmann, T., Glavaš, G., Habernal, I., Kersting, K., Kreuter, F., Mezini, M., Gurevych, I., Hüllermeier, E., & Schütze, H. (2025). Problem solving through human–AI preference-based cooperation. Computational Linguistics, 51(4), 1337–1372. https://doi.org/10.1162/COLI.a.19

본 글은 공개된 연구를 바탕으로 정보 제공 목적으로 작성되었으며, 전문적인 판단을 대신하거나 의학적 진단이나 치료를 위한 근거로 사용될 수 없습니다.

댓글