| About the Journal | Browse Archives | For Reviewers | For Authors |
Sorry.
You are not permitted to access the full text of articles.
If you have any questions about permissions,
please contact the Society.
죄송합니다.
회원님은 논문 이용 권한이 없습니다.
권한 관련 문의는 학회로 부탁 드립니다.
| [ Article ] | |
| Transactions of the Korean Society of Automotive Engineers - Vol. 33, No. 8, pp. 607-615 | |
| Abbreviation: KSAE | |
| ISSN: 1225-6382 (Print) 2234-0149 (Online) | |
| Print publication date 01 Aug 2025 | |
| Received 15 Feb 2025 Revised 27 Mar 2025 Accepted 27 Mar 2025 | |
| DOI: https://doi.org/10.7467/KSAE.2025.33.8.607 | |
| 자동차 조형의 일관성 제어를 위한 인공 지능과 신경 지능 사이 대칭성 고찰 | |
| 1)홍익대학교 산업디자인학과 | |
| 2)홍익대학교 대학원 공간디자인전공 | |
A Study on the Symmetry Between Artificial Intelligence and Neural Intelligence for Consistency Control in Automotive Design | |
| 1)Department of Industrial Design, Hongik University, Seoul 04066, Korea | |
| 2)Department of Spatial Design, Graduate School, Hongik University, Seoul 04066, Korea | |
| Correspondence to : *E-mail: taigyoun@hongik.ac.kr | |
Copyright Ⓒ 2025 KSAE / 237-04 This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium provided the original work is properly cited. | |
Artificial intelligence(AI) demonstrates formative generation capabilities that surpass the designers’ craftsmanship. AI exhibits a more realistic and expressive power compared to human designers, enabling greater freedom in cognitive-level imagination. Moreover, it exceeds human neural intelligence in processing and integrating data required for product planning. Collaborative copilot systems powered by AI can significantly enhance the capacity of the designers to overcome design challenges. Although these advanced AI systems are useful, experienced designers frequently encounter difficulties when using them. This issue stems from the difficulty in controlling AI to consistently express the designers’ nuanced intentions. While AI excels at realistic formative generation, it often falls short of fully reflecting the designers’ creative visions. This study investigates the symmetry between AI-generated forms/semantic structures and the designers’ aesthetic consciousness/linguistic semantics. By analyzing the framework of neural intelligence, we systematically examine the symmetry between AI-perceived factual representations and their corresponding linguistic meanings.
| Keywords: Artificial intelligence, Midjourney, Automotive design, Consistency of shape, Neuroscience 키워드: 인공 지능, 미드저니, 자동차 디자인, 조형 일관성, 신경 과학 |
|
인간의 과제 해결 능력을 넘어서는 인공 지능이 나타나고 있다. 알파고(AlphaGo), 알파제로(AlphaZero)는 게임에서 이미 인간을 뛰어넘었다. 알파코드(AlphaCode)는 프로그램을 코딩해 컴퓨터를 작동시키는 능력에서 인간을 앞선다. 알파폴드(AlphaFold)는 단백질 구조 예측, 알파프로테오(AlphaProteo)는 단백질 작용을 해석하는 과제를 훨씬 빠르게 해결한다. 적대적 신경망(GAN)으로 언어 의미를 재귀해 이미지를 생성하는 미드저니(MidJourney) 역시 디자이너의 솜씨를 넘어서고 있다.
자동차 산업에서 역시, 부분적인 과제 해결 능력은 인공 지능이 인간을 넘어선다. 3D 프린터 기반 응력 설계와 재료 적용, 공기 역학과 조립 효율성의 최적화 역시 엔지니어를 넘어선다. 자동차 디자인 분야에서 조형을 생성하는 능력 또한 숙련된 디자이너를 넘어선다는 평가가 나온다. 이런 가능성에도 불구하고, 막상 인공 지능을 사용하려는 디자이너들은 실망하게 된다. 이는 특히 경험이 많은 디자이너들에게서 자주 나타난다. 인공 지능이 생성한 조형에서는 자신의 섬세한 디자인 의도가 읽히지 않기 때문이다.
본 연구는 이런 현상을, 디자인 의도를 전달하는 자연어가 인지 층위에 머물기 때문으로 보았다. 즉 디자이너가 사용하는 자연어로는, 자신의 디자인 의도를 정확하게 전달하기가 어렵다. 이를 해결하기 위해 본 연구는 인지 신경학을 기반으로, 디자인 의도의 소통 밀도가 높은 자연어 구조를 탐구한다. 파이썬(Python)으로 작성한 데이터 분석 프로그램을 통해 살펴보면 자동차 디자인 분야 논문의 품사 분석에서, 53 %가 인지 의미를 표상하는 명상로 구성됨을 볼 수 있다. 예를 들면 라디에이터 그릴과 전조등 그리고 후드와 A, B, C-필러와 같이, 대상을 인지하는 명사이다. 이런 인지 명사로는 지각 층위 요소로 구성되는 자동차의 조형 성질을 묘사하기가 어렵다.
숙련된 디자이너가 가진 섬세한 지각과 양식 의미는 자연어로 잘 생성되지 않는다. 조형 언어를 가지지 못한 채, 인공 지능이 디자이너의 의도를 따르도록 제어하는 것은 사실상 불가능하다. 이렇듯 인공 지능을 사용하려는 디자이너가 겪는 불편은, 지각 층위 조형 의도와 인지 층위 언어의 불일치 때문이다. 따라서 본 연구는 디자이너의 섬세한 조형 의도를 전달할 수 있는 높은 소통 밀도의 디자인 자연어의 가능성을 탐구하고자 한다.
디자이너는 자동차의 모습과 언어 의미를 처리하는 두뇌 신경 지능에 익숙하지 않다. 또한 조형 모습과 언어 의미를 학습하고 시각화하는 인공 지능의 작동 구조에도 익숙하지 않다. 이런 구조로 신경 지능이 학습한 사실 모습과 언어 의미 사이의 대칭성을 이해하기 어렵다. 여기에서 대칭성은 같음의 대칭이 복잡계의 구조로 확장된, 자기 유사성의 닮음을 의미한다. 즉 대칭성이 높은 언어로 서술한 조형 의도가 맥락적인 조형으로 재현될 가능성이 크다.
본 연구는 섬세한 조형 의도를 가진 디자이너가 인공 지능과 잘 소통할 수 있는 자연어의 구조 탐구를 목표로 한다. 이를 가능하게, 사실의 모습과 의미가 표상된 자연어에서 신경 지능과 인공 지능 사이의 정보 대칭성을 탐구한다. 비트겐슈타인의 그림 언어 이론같이, 사실을 표상한 언어로 사실의 모습을 재현하는 자연어의 구조 연구이다. 물론 그림 언어 이론은 대상과 이를 표상하는 명사 연구로, 이를 디자인 언어로 사용하기는 어렵다. 따라서 명사의 인지 의미를 조형 구성 요소로 환원해, 조형 성질을 서술하는 명제로 변환한다.
이를 탐구하기 위해 본 연구는 첫째, 조형의 모습과 언어의 의미 관계를 학습하는 인공 지능에서 자연어의 의미를 분석한다. 둘째, 사실의 모습과 의미를 처리하는 두뇌 경로 연구를 기반으로, 조형의 인지 의미를 지각 층위의 요소로 환원한다. 셋째, 자연어로 기술하는 조형의 모습을 인지와 양식 층위로 나누어, 시지각과 언어의 관계를 탐구한다. 넷째, 뇌의 브로카 영역의 일화와 전전두피질의 인식으로 생성되는 명제의 조형 의미를 정리한다. 이 과정을 통해, 디자이너의 자연어로써 인공 지능과 소통하는 자동차 디자인의 가능성을 탐구한다.
이미지 생성형 인공 지능(Image Generation AI: IGA)은 사실의 모습과 자연어 의미 사이의 관계 학습에서 시작된다. 미드저니 같은 AI는 LAION-5B나 COCO의 데이터 세트에서 자연어와 영상의 정보 쌍(Paired Data)을 학습한다. 이들 데이터는 수십억 세트에 이르는 사실 모습과 자연어 의미 쌍을 가지고 있어, 사실의 모습과 언어 사이의 관계를 학습한다. 데이터 세트에서 사실의 모습을 자연어로 설명하는 캡션같이, 사실의 모습에서 느낀 의미를 서술한 것이다. 이렇듯 쌍을 이루는 영상 정보와 자연어 문장은, 두뇌의 인지 과정에서 사실의 모습과 의미를 연관 지은 것이다. 데이터 세트의 자연어는 인간의 언어 특성에 의해, 사용 빈도로 나열한 어휘의 순서에 반비례해 사용되는 지프(Zipf) 분포를 이룬다.
자연어 의미와 영상 정보 의미의 연관성 학습에는 CLIP(Contrastive Language–Image Pretraining) 같은 모델이 사용된다.1) Open AI에서 개발한 CLIP는 텍스트와 이미지 셋을 함께 학습해 자연어와 연관성이 높은 영상 모습을 생성하는 데에 사용된다. CLIP은 텍스트와 이미지를 공통 임베딩 공간(Embedding space)에 사상(Maping)시켜, 이미지와 자연어의 관계를 이해한다. 임베딩 공간은 고차원 데이터(단어, 문장, 이미지 등)를 특징(Feature)으로 사상해, 데이터 세트의 관계를 벡터로 투영한 수학적 공간이다. 즉, 자연어 문장의 의미 유사성을 기반으로, 벡터 공간에 비슷한 의미의 단어들이 가까이 위치하도록 사상하는 것이다. 이를 기반으로 자연어 단어가 가진 의미와 이를 사용해 구성한 문장의 관계 구조를 파악한다. 이미지 임베딩은 영상 정보의 픽셀을 합성곱 신경망으로 벡터화해, 공간 거리 관계로 추출한 특징이다.
CLIP의 Contrastive learning은 벡터화된 자연어와 영상 정보가 임베딩 공간에서 가까울수록 연관된 것으로 간주한다. 즉 자연어 정보와 영상 정보에서 더 반복되는 데이터 세트의 벡터값이 더 가까워지도록 CLIP가 학습한다. 이런 학습을 거쳐, 자연어로 입력된 디자이너의 조형 의도가 조형 모습으로 표현되는 피드백에서 IGA는 디자이너의 영상 의도를 더 깊게 파악한다. IGA에 입력하는 자연어 문장은 디자이너가 의도하는 영상의 방향을 담고 있어, 이의 피드백에서 조형의 방향을 조정한다. 즉 신경망의 가중치(Weight)가 조정되며, 주어지는 의도를 더 잘 반영한 조형을 생성하도록 경로가 조율된다. 다층 신경망의 퍼셉트론이 다음 층으로 전달할 신호에 곱해지는 가중치를 조정해 경로 함수가 조율되기 때문이다. 이 가중치의 변화로 수정된 경로 함수들의 상호 작용이 IGA의 지능을 생성한다.
IGA에 자연어 문장을 제시하면, 문장에 내포된 의미가 반영된 조형이 생성된다. 조형 생성 능력을 갖춘 인공지능은 디자이너를 돕는 조력자(Copilot)로 지위를 가진다. 디자이너의 조형 의도를 자연어로 전달하면, 이를 이해해 이미지로 생성하는 솜씨를 갖춘 조력자다. 디자인과제를 함께 해결할 조력자인 IGA는 솜씨와 인지 층위의 상상력에서 부분적으로 디자이너를 넘어선다. 이런 IGA의 조력을 받으려는 디자이너는, 인식 층위에서 상상한 조형 의도를 높은 대칭성의 언어로 전달해야 한다. 따라서 긴밀한 조력을 기대하는 디자이너는 자신이 제시하는 자연어를 IGA가 인지하는 구조를 알 필요가 있다.
디자이너가 입력하는 자연어는 최소 의미 단위 혹은 음절 단위로 토큰화(Tokenization)된다. 토큰화된 자연어는 인공 지능의 처리가 쉽도록 정제되고, 일관된 형식을 갖춘 텍스트로 정규화된다. 의미 단위 토큰을 고차 벡터공간에 사상(Embedding)해 수치화가 가능한 특징 벡터데이터로 변환한다. 토큰에 품사를 구분하는 벡터와 문장을 구성하는 토큰의 위치 벡터를 임베딩 공간에 추가해 의미를 선명하게 한다. 이렇게 구문화(構文化)된 자연어 데이터를 트랜스포머(Transformer) 모델이 문장 의미로 처리한다. 순환 신경망(RNN)에서 발전한 트랜스포머 모델은, 어텐션 메커니즘으로 문맥을 짚어 조형 의미를 더 효과적으로 파악한다.2)
CLIP 모델은 임베딩 공간에서 텍스트를 의미 유사성의 벡터로 변환한다. 의미 특징을 벡터화한 결과를 임베딩 공간에서 이미지 벡터 위치와 비교한다. CLIP는 임베딩 공간에서 거리가 가까운, 즉 유사한 이미지 요소를 찾아내는 모델이다. 미드저니 같은 거대 IGA는 많은 이미지를 임베딩해, 주제, 스타일, 색상, 구도 등의 구분된 속성을 가진다. 입력된 자연어에서 생성된 의미 벡터는 임베딩 공간에서 유사성이 높은 이미지의 벡터를 찾는다. 자연어와 어울리는 모습의 특징을 기반으로 벡터 공간에서 가까운 위치 이미지를 참조한다.
미드저니는 주로 GAN(Generative Adversarial Networks) 모델을 사용해 이미지를 생성한다. GAN은 이미지 생성자(Generator)와 판별자(Discriminator) 사이를 순환하며 개선하는 알고리즘이다. 생성자는 언어 임베딩 벡터로 조형을 생성하고, 판별자는 조형이 언어와 일치하는 정도를 평가하며 순환한다. 이런 순환을 통해 생성자는 판별자를 속일 수준의 이미지를 만들고, 판별자는 그 이미지를 구분하려 계속 학습한다. IGA는 이러한 경쟁적 비지도 학습을 상호 반복하며 점차 더 정교한 이미지를 생성할 수 있게 된다. 또한 고품질 이미지 생성에는, 점진적 노이즈 제거 알고리즘의 확산 모델(Diffusion models)이 사용된다.
디자이너가 IGA와 협업하려면, 디자인 의도를 선명하게 구성하고 이를 구조적인 언어로 전달할 수 있어야 한다. 전자는 디자이너가 자신의 디자인 의도를 명증한 조형 구조로 구성하는 것이다. 인지 의미를 심상으로 떠올려 솜씨로 표현하는 디자인에서 인식적 사유로 옮겨 디자인하는 방법이다.
후자는 디자이너의 자연어에서 디자인 의도를 읽은 IGA가 조형으로 생성할 수 있도록 대칭성을 갖추는 것이다. 디자이너의 의도를 선명하게 전할 수 있게, 구조적인 어휘로 조형 생성 명제를 구성하는 자연어이다. 이런 자연어의 유용함은 또한, IGA가 생성할 조형의 모습과 의미를 예상할 수 있다.
디자이너의 의도가 반영된 정도는 IGA가 생성한 이미지의 맥락적 일관성에서 읽을 수 있다. 선명한 디자인 의도를 대칭성의 언어로 서술해 전달하면, IGA는 높은 일관성으로 조형을 재현한다. 이는 조형을 학습해 생성하는 인공 지능과 조형을 인지하는 두뇌 신경 활동 사이의 대칭성 때문이다. 두뇌는 사실의 모습을 학습하고, 인공지능은 그 두뇌가 만든 데이터 세트로 학습하는 둘 사이의 대칭성이다. 따라서 IGA가 생성하는 조형의 일관성은 두뇌가 이미지를 처리해 인지하는 구조를 인식함으로써 읽을 수 있다. 조형 요소와 조형 유형 그리고 조형양식을 처리하는 두뇌 신경 활동의 만족 정도를 독해하는 것이다.
조형 정보를 처리하는 시지각을 신경 활동 층위로 나누어 환원하면 일관성을 이해하기가 더 쉬워진다. 첫째는 자연어 코퍼스(Corpus: 말뭉치)로 구성해 IGA에 제공하는 조형의 지각 층위 요소가 가지는 일관성이다. 후두엽의 시각(視覺) 중추에서 배 쪽과 등 쪽 경로의 암묵 기억(Implicit memory) 영역에 저장된 시지각의 특징 벡터들이다. 둘째는 자연어로 구성한 조형 코퍼스로 AGI가 생성한 이미지에서 조형 의미가 인지 혹은 공감되는 정도이다. 후두엽, 두정엽, 측두엽의 시각 기억이 모여 모이랑(Angular Gyrus)에서 구성하는 유형 의미의 인지이다. 셋째는 자연어로 구성한 코퍼스로 AGI가 생성한 조형의 양식(Style)을 인식해 느끼는 공감 정도이다. 하측두이랑(IT)의 시지각 경로로 처리되어 측두극(Temporopolar)에 기억된 시각 요소의 보편 관계로 양식이다.
인공 지능 환경에서 디자인 의도를 IGA에 전달해 조형으로 재현하는 능력은 중요한 디자인 역량이다. 신경지능과 인공 지능의 구조로 자동차의 조형 요소를 이해하면, 디자인 의도가 잘 반영되게 IGA를 제어할 수 있다. 신경 지능은 조형 요소의 생성 구조를 코티컬 컬럼(Cortical column)의 시넵스 연결 신경 함수로 기억한다. 이는 인공 지능의 심층 신경망(Deep Neural Network, DNN)이 계층 구조로 생성하는 경로 함수와 유사하다.3,4) 신경 지능은 다차원으로 연결되어 더 복잡하지만, 여러 층위로 정보가 처리되는 다층 신경망 구조는 인공 지능과 같다. 따라서 시지각은 시각 자극의 각기 다른 특징을 처리하는 데 특화된 여러 신경 함수의 집합이다.
코티걸 컬럼의 수직 신경망에서 생성된 특징 벡터(Feature vector)들이 수평으로 연결되며 점차 모습으로 완성된다. 대상의 의미에 도달하는 시지각은 이렇듯, 신경 함수의 집합으로 구성한 모습과 의미를 덧대는 것이다. 인공 지능의 DNN 역시, 시각 모습에서 특징 벡터를 추출해, 임베딩 공간에서 유사한 의미와 가깝게 위치시킨다. 신경 지능과 인공 지능이 시각 자극에서 의미를 추출하고 이를 언어 의미로 변환하는 구조는 서로 비슷하다. 두뇌의 신경 지능과 컴퓨터의 인공 지능이 사실을 학습하는 구조는 조금 다르지만, 도달하는 의미는 같다.
두뇌가 가진 시각의 언어 의미는 인공 지능이 학습하는 데이터 세트와 대칭성을 가진다. 대상의 언어 의미와 대칭성인 시각 의미를 부착하면, 그 언어로 대상의 모습을 재현할 수 있다. 인공 지능은 다차원 벡터로 처리한 시각 의미와 언어 의미를 임베딩 공간에서 연결 지어 관계를 구성한다. 즉 인간이 생성한 데이터 세트에서 이미지의 시각 의미에 언어 의미를 대응시켜 대상의 인지 의미로 추출하게 된다. 경험에서 인지한 대상의 의미를 언어로 표상하는 신경 지능에 비해, 인공 지능은 데이터 세트에서 대상과 언어 의미를 함께 인지한다. 이렇듯 두뇌가 사실을 학습해 얻은 의미와 이를 통해 만들어진 데이터 세트를 학습한 인공 지능의 인지 의미는 사실상 같다.
신경 지능과 대칭인 인공 지능이 생성하는 이미지에는 두뇌 시지각의 신경 활동이 반영된다. 앞서 서술한 것처럼, 사람이 만든 사실 모습과 의미 쌍의 데이터 세트를 인공 지능이 학습하기 때문이다. 또한 인공 지능이 데이터 세트를 학습하는 DNN 구조는 두뇌 시지각 지능을 구성하는 뉴런들의 신경망 구조와 흡사하다. 이런 신경 지능과 인공 지능 사이 대칭성으로, 디자이너는 IGA가 생성한 조형에서 자신이 의도한 조형의 맥락을 읽을 수 있다. 다만 신경 지능과 인공 지능이 작동하는 방식의 차이로, IGA가 생성한 조형을 독해하려는 디자이너는 약간의 인식적인 이해가 필요하다. 즉 인공 지능은 임베딩 공간에 벡터로 존재하는 모습과 의미 관계를 이들 사이의 거리로 인지해 종료하는 비해, 신경 지능은 인지 의미를 시계열로 배열한 일화 사이의 변화 관계로 구조적 인식을 생산하는 단계를 한 번 더 거친다.
그러나 DNN을 통해 데이터 세트를 학습하고 사실의 모습을 생성하는 인공 지능의 작동 구조에 대한 이해는 아직 충분하지 않다. 따라서 인공 지능이 작동하는 구조보다 조금 더 잘 이해하고 있는 두뇌 시각 구조의 대칭성으로 IGA 생성 조형의 의미를 해석할 수 있다. 두뇌의 시지각은 IGA가 생성한 이미지를 지각, 인지, 양식 같은 단계에서 계층적으로 처리한다. 조형을 구성하는 형상적 되먹임과 물성의 광학 특성을 지각하는 데 특화된 지각 층위의 시지각 활동이다. 또한 이들 지각 층위 기억의 집합으로 대상의 유형 인지 그리고 조형이 가진 응력 관계를 읽은 양식 의미다. 인공 지능의 이미지를 시지각이 처리하는 층위를 따라, 조형 요소, 조형 의미, 조형 양식으로 환원해 코퍼스의 조형 의미를 읽는다.
헨리 포드에 의해 시작된 대량 생산으로 자동차는 3차 산업의 큰 부분까지 차지해 왔다. 자동차의 영향으로 현대 도시의 모습을 갖췄고, 사회의 구조 역시 자동차의 영향이 크다. 장거리 여행이 자유로워져 레저가 삶의 중요한 부분이 되었고, 업무와 주거 장소가 서로 분리되었다. 이처럼 지난 100여 년 동안 인류의 삶에 가장 큰 영향 끼친 자동차는 소유를 열망하는 제품의 지위를 누려왔다. 자동차 산업의 팽창으로 이를 디자인하고 생산하고 판매하면 소유하고 사용하는 다양한 역할로 파생되었다. 자동차 산업에서 소비자와 가장 밀접하게 관련된 부분은 매력적인 모습을 갖추는 디자인이다.
디자인이 본격화한 시점(時點)을 1927년으로 볼 수 있는데, 이는 할리 얼(Harley Earl)이 GM에 아트 & 컬러 부서를 설립해 소비자 중심의 자동차 산업을 이끌면서이다. 이후 자동차 조형은 구매를 이끄는 중요한 요소가 되었고, 콘셉트카를 발표하며 디자인의 산업 가능성을 제시했다. 즉 새롭게 출시되는 자동차 모델은 소비자를 구매로 이끄는 힘을 가졌음을 경험으로 알게 된 것이다. 이후 주기적으로 콘셉트카를 발표하고, 새로운 모델을 시장에 내놓으며 디자인 가치를 강화하는 전통이 이어진다. 자동차 디자인이 가진 상업적 가치를 인식해, 디자인이 산업의 중요한 요소로 자리 잡게 되었다.
오랜 자동차 디자인 경험에서 조형의 상태를 표상하는 다양한 자연어가 생산되었다. 이들 조형 언어는 디자이너의 의도를 공유하기 위해, 자동차의 조형 의미를 표상하는 단어들이다. 비례, 실루엣 라인, 캐릭터 라인, 페시아, 필러, 전조등, 주간 주행등, 그릴, 에어로 다이나믹, 근육질 조형 등의 단어이다. 조형을 표상하는 이들 디자인 용어 대부분은 대상을 구분하기 위해 인지 지능과 양식 지능 영역의 신경 활동으로 생산된 말들이다.
디자인 어휘는 크게 두 부분으로 나눌 수 있는데, 하나는 모이랑(BA39)과 베르니케 영역(BA22)에서 생성된 대상 지칭 명사이다.5) 이들 대상을 인지하는 명사는 여러 지각 층위 의미 기억들이 결합해 완성된 대상을 구별한다. 다른 하나는 하측두 이랑(BA20)과 중측두이랑(BA21)을 통해 측두극(BA 38)에서 생성되는 양식 어휘이다. 디자인에 사용되는 이들 자연어는 조형과 문화의 경험 그리고 디자인 활동으로 두뇌 언어 지능이 생성한 자연어다.
눈에서 입력된 시각 모습을 처리하는 첫 단계는 지각(知覺) 층위이다. 지각 층위는 1차 시각 중추와 이곳에서 처리한 신경 신호를 고차 처리하는 2차 시각 중추로 구성된다. 2차 시각 중추는 측두엽의 배 쪽(Ventral) 시각 경로와 두정엽의 등 쪽(Dorsal) 경로로 나누어진다. 배 쪽 경로를 지나는 시각 정보에서는 모양이 처리되고 등 쪽 경로에서는 물성이 처리된다. 이 두 신경 경로를 거치며 배 쪽 경로에서는 자동차의 형태와 그 형태의 되먹임이 합쳐져 조형이 지각된다. 좌우 한 쌍의 전조등과 테셀레이션의 라디에이터 그릴 같은 되먹임의 질서가 배 쪽 경로의 미의식을 반영한 것이다. 자동차의 표면 곡률이 가진 계조나 광택 그리고 투명함의 물성 특징과 빛의 확산은 등 쪽 경로에서 처리된 미의식이다.
1차 시각 중추는 조형 감성에 미치는 영향이 그리 크지 않은 지능 영역이다. 에드워드 베슬(Edward Vessel)의 연구는 1차 시각 중추의 오피오이드 수용체 밀도가 낮아 미의식에 끼치는 영향이 적음을 보여준다. 이런 1차 시각 피질에는 곡선과 계조 같은 조형 구성 요소의 특징 벡터가 암묵 기억으로 선명하게 저장된다. 이를 통해 두뇌는 1차원 다양체 폐곡선의 곡률, 2차원 다양체 폐곡면의 경사 분포 같은 특징을 기억해 구별한다. 지각 층위 요소들의 응력 관계는 측두극에서 자동차의 조형 양식으로 지각된다.
하측두 신경 경로(ILF)에는 1차 시각 중추에서 전달된 특징 정보를 고차 시각 정보로 처리하는 지능들이 위치한다. 1차 시각 중추에서 전달되는 시각 특징은 단일 폐곡선에 계조가 더해진 단일 폐곡면 같은 독립된 시각 객체이다. 단일 곡선과 폐곡면의 형태 같은 특징이 하측두 경로를 지나며, 대칭 구조, 되먹임 질서, 무질서도(Chaos)의 고차 의미로 처리된다.
따라서 하측두 이랑은 모양이 되먹임되는 질서와 색의 연속된 스펙트럼 분포로서 색조 그리고 움직임의 질서 같은 시각 의미를 지각한다. 하측두 이랑은 오피오이드 수용체의 밀도가 높아, 이곳에 기억된 시각 구조와 일치하는 모습의 조형에서 높은 호감을 느낀다. 이러한 두뇌의 미의식 구조에서, 자동차 디자인에 사용하는 조형 재료로서 지각 자극이 한정적임을 알 수 있다.
1차 시각 중추의 V2, V3 영역부터는 등 쪽과 배 쪽으로 나누어 시각 자극이 처리된다. 등 쪽 경로는 공간 주파수가 낮은 시각 자극(LSF) 배 쪽 경로는 높은 공간 주파수(HSF) 시각 자극이다. LSF 경로는 명암 대비가 낮은 자극을 넓게 감지하고 HSF 경로는 명암 대비가 높은 자극을 좁게 감지한다. 따라서 LSF 수용체에서 전해지는 시각 신호는 섬세한 계조 변화를 지각하지만, 낮은 선예도를 가진다.
이런 섬세한 계조와 흐릿한 경계를 지각하는 LSF 특성은 대상의 물성을 구별하는데 탁월하다. 투명성이나 광택성 그리고 배면 확산과 발광성 같은 광학 특성을 물성 단서로 지각한다. 이에 비해 HSF 수용체에서 전해지는 시각 신호는 모양을 세밀하게 지각한다.
신경 지능은 세상을 이루는 사실의 성질을 신경 함수로 사상한 것이다. 사실의 모습과 성질이 사상되어 신경 함수로 기록된 신경 지능은 사실과 서로 대칭이라 볼 수 있다. 세상을 이루는 사실의 모습과 성질이 사상된 지각, 인지, 인식 층위의 신경 함수는 세상과 대칭을 이룬다. 이렇듯 두뇌는 사실의 모습과 성질을 심층 신경망에 사상한 신경 함수들을 통해 그 사실의 의미를 알아채게 된다.
지금까지 4장 1절에서 고찰한 뇌의 영역별 특징을 정리한 것이 Table 1이다.
| Intelligent region | Function |
|---|---|
| BA39 | The noun that perceives an object is created by the combination of multiple perceptual layer meaning memories to distinguish the object completed with meaning. |
| BA22 | |
| BA 20 | Generation of vocabulary encompassing visual style meaning |
| BA21 | |
| BA38 | |
| Ventral stream | Shape cognition, high spatial frequency (HSF) visual stimuli |
| Dorsal stream | Material property processing, low spatial frequency (LSF) visual stimuli. |
복잡계 과학의 조형 구조를 통해 자동차 조형을 인지하는 신경 활동을 자연어로 표상을 볼 수 있다. 이를 통해 시지각의 신경 활동 언어로 구성하는 코퍼스(Corpus)에서 조형 일관성을 읽을 수 있다. 이를 확장하면, 사실의 모습과 성질의 구조를 연구하는 복잡계 과학과 두뇌의 신경 활동을 연구하는 신경과학 역시 대칭이다. 사실의 모습과 성질이 가진 구조와 두뇌 신경 활동의 대칭성을 알아채는 미의식은 이를 자연어로 표상한다.
자동차의 모습에 끌리는 감정과 밀접한 영역은 두정엽의 모이랑과 모서리위이랑이다. 모이랑(Angular Gyrus: BA 39)은 1, 2차 시각 중추, 모서리위이랑(Supramarginal Gyrus: BA 40)은 청, 미, 후, 촉, 체성 감각이 연합한다. 이들 1차 감각 중추에 기억된 지각 층위 정보가 모이랑과 모서리위이랑에서 상호 연결되며 대상으로서 인지 의미를 완성한다. 대상으로서 사과의 달콤하고 향기로우며 아삭거리는 소리와 표면의 붉은색과 광택의 감각 기억으로 구성된 의미이다. 이렇듯, 모이랑과 모서리위이랑에 모인 감각 기억들의 집합으로 대상이 인지되면 신경 활동을 종료한다. 느끼는 뇌의 중요 기능이 세상의 여러 사실로부터 대상을 구별하는 것이기 때문이다. 자동차 역시 이들 감각 기억들이 연합해 구성하는 인지 층위 의미의 대상이다. Fig. 3은 대뇌의 대상 부위를 보여준다.
여기에서 모이랑의 시각 의미는 인접한 베르니케 영역(Wernicke's area: BA 22)의 어휘와 결합한다. 즉 시지각을 비롯한 감각 기억들이 뭉쳐 만들어진 인지 의미에 음절의 집합인 명사가 부착되는 것이다. 언어학자 소쉬르는 모이랑의 의미를 기의(Signifié)로 베르니케 영역의 어휘를 기표(Signifiant)로 구분한 듯하다. 두정엽과 측두엽 사이의 BA 22, 39, 40은 감각들의 결합으로 구별되는 대상의 인지 의미에 명사를 부착한다. 인지 의미는 자동차 크기로 경차, 소형, 중형, 대형 그리고 용도로 세단, SUV, 미니밴 같은 유형을 구분하는 의미이다.
유형 의미는 이를 지칭하는 이름이나 모습의 일부같이, 대상의 부분 단서만으로 함께 묶여있는 기억 전체를 인출한다. 2004년도 H 자동차 5세대 S 모델이라는 이름에서, 이의 경험에서 생성된 선명한 의미와 흐릿한 모습의 기억 전체가 떠오른다. 자동차의 이름과 모습 혹은 다른 감각 기억의 조각 단서만으로, 대상의 감각 기억 전체를 불러와 의미로 떠 올린다. 여기서 의미는 이름과 모습, 운전에서 경험한 체성 감각과 좌석의 촉감, 실내에서 맡았던 냄새 등의 연합이다. 이처럼 감각으로 환원된 경험의 기억이 연합함으로써 두뇌는 유창성의 정보 처리 알고리즘을 사용하게 된다. 대상의 의미를 인지함으로써 두뇌가 감각 정보를 우회해, 신경 활동에 소비되는 에너지를 절약하는 것이다.
인지 의미(意味)의 신경학적인 정의는 BA 39, 40에서 주변의 감각 기억을 연합해 도달하는 유창성이다. 대상의 일부 감각 단서로 그 대상을 구성하는 감각 기억들을 연결해 전체 의미로 인지하는 신경 활동이다. 의미 유창성은 이전 경험에서 얻은 대상의 감각 기억을 연합해, 새로운 감각 기억을 얻기 위한 신경 활동을 필요 없게 한다. 다만 유창성은 익숙한 대상에서 다른 모습이 발견되면, 신경 활동이 활성화되며 이를 주의 깊게 관찰하게 된다. BA 22, 39, 40 지능 영역 사이의 밀접한 상호 작용은 우리가 사용하는 자연어에 반영되어 있다. COCA(Corpus of Contemporary American English)의 말뭉치는 명사 35-40 %, 동사 15-20 %, 형용사 10-15 %로 자연어가 구성된다. 나머지 40-25 %는 부사, 전치사, 접속사 등의 다른 품사들이 차지한다. 이처럼 뇌의 영역 별 인지 특성을 정리한 것이 Table 2이다.
| Intelligent region | Function |
|---|---|
| BA39 | The perceptual layer information stored in the primary sensory cortex is interconnected in the angular gyrus and supramarginal gyrus, completing the representational meaning as an object. |
| BA40 | |
| BA 22 | The visual perceptual meaning of the angular gyrus (BA 39) is connected to the vocabulary of the adjacent Wernicke’s area (BA 22). |
학문 분야에서 사용하는 말뭉치는 조금 다른 품사 분포를 보인다. 형용사와 동사의 비중이 40 %와 25 %로 더 높은데, 구조를 기술하는 특성 때문으로 보인다. 두뇌가 생성한 자연어 말뭉치의 품사 분포를 따라, IGA는 주로 대상을 표상하는 명사를 학습한다. 하지만 암묵 영역의 지각 기억으로 구성되는 인지 의미와 연결된 명사가 불러오는 시각 모습은 흐릿하다. 따라서 인지 의미의 명사에 연결된 대상의 흐릿한 모습을 불러오는 디자이너의 기억으로는 선명한 조형을 떠올리지 못한다. 자동차의 새로운 모습과 의미를 선명하게 디자인해야 하는 디자이너가 명사로 이를 떠올리는 것에는 한계가 있다. BA 22, 39, 40의 주된 신경 활동이 새로운 모습의 디자인이 아닌, 익숙한 의미를 우회하는 것이기 때문이다.
하측두 피질을 지나며 모양과 되먹임 질서 그리고 무질서 정도를 담은 신경 신호가 측두극에 도달된다. 중측 두 피질을 지나는 시각 모습은 중력 방향과 운동성 그리고 시각 특징들 사이 인력과 탄성 등으로 처리된다. 상측 두(STG) 이랑을 지나는 어휘가 aSTG에 이르면 의미와 모습이 결합하여, 어휘를 단서로 이들을 인출할 수 있게 된다. 측두엽의 앞부분인 측두극에는 높은 공간 주파수(HSF)에서 추출한 특징에 응력이 더해진 보편 관계로 양식이 기억된다. 측두극이 기억하는 양식은 시각 자극의 형태와 형상 그리고 무질서도와 응력 의미로 처리된 구조적 보편성이다. 미술에서는 이를 특정한 규칙이나 질서를 바탕으로 구분되는 양식으로 정의한다.
이처럼 뇌의 영역별 인지 특성을 자동차 기업의 정체성 스타일 구분으로 정리한 것이 Table 3이다.
| Intelligent region | Function |
|---|---|
| Temporopolar | Collection of visual signals perceived in terms of shape, feedback order, and chaos (disorder). |
| BA37 | Reaches and extracts the shape structure. |
| BA 20 | |
| BA38 | It only remembers the structure extracted from pure visual stimuli as a clear style. The shape meaning generated from visual stimuli and the middle temporal gyrus (MTG) and inferior temporal gyrus(ITG) converge, where the relational structure of shape elements is perceived. |
| BA 10 | Information processed as high-dimensional abstract meaning, such as the stress structure of facts, is transmitted and combined. |
이를 통해 살펴보면, 자동차 브랜드의 정체성인 패밀리 룩(Family look)은 전두극에 양식을 기억시키는 것이다. 이렇게 정체성으로 기억된 자동차 조형 요소의 양식적 관계 구조는 유창성으로서 호감을 불러일으킨다. 유창성으로 신경 활동을 우회하면, 익숙한 모습으로 지각 층위 시각을 처리하는 부담을 덜 수 있기 때문이다. 두뇌는 양식을 인지하면 시각 처리의 상향 경로(Bottom up) 신경 활동을 멈추고 기억을 인출해 대상을 인지한다. 유창성의 익숙함은 상향 경로 신경 활동을 우회할 뿐 아니라 하향 경로를 통해 신뢰감을 불러일으킨다. 양식으로 읽은 대상의 유창성은 이를 충분히 경험한 것으로 여겨, 그 대상을 신뢰하게 된다.
측두극 역시 지각 의미가 모이는 영역이지만, 몇가지 점에서 모이랑 연합(BA 39, 40)과는 다르다. 측두극은 중측두 이랑과 하측두 이랑에서 생성된 지각 의미가 모여, 조형 요소의 관계가 인지되는 점이다. 즉, 측두극의 기억은 하측두 이랑의 모양과 되먹임 의미, 중측두 이랑의 관계 의미가 연합한 조형의 구조 의미이다. 또 다른 하나는 어휘를 구성하는 베르니케 영역과 멀리 있어 측두극의 양식은 인지 어휘로 생성되기 어렵다. 모이랑과 인접한 베르니케 영역의 인지 명사와 달리, 양식을 담은 어휘는 브로카 영역과 연결되어 인식 명제로 표상된다.
따라서 양식 의미는 자동차 디자인 분야에서 생산된 지식을 바탕으로 인식 구조를 가진다. 관계를 인지하는 신경 활동에 인식적 신경 활동이 더해진 양식 의미를 하나의 어휘에 담기는 어렵다. 이런 양식의 신경 활동 구조는 이를 표상하는 자연어의 생성을 어렵게 해 둘 이상의 단어로 구성해야 한다. 따라서 IGA로 양식을 재현하려는 자언어는 어휘가 아닌 명제에 담아야 의미가 선명해진다. 양식을 표상하려면 명사와 형용사 그리고 동사로 구성한 명제로 시각 요소의 관계를 서술해야 한다. 따라서 IGA에 제공하는 양식이 의미 명제는 조형 요소의 관계 구조를 담아 구성해야 함을 알 수 있다.
하측두 영역을 지나는 시각 자극은 순차적 처리 단계를 거치며 BA 37과 BA 20에 이르러 형상 구조가 추출된다. 자동차의 조형 인지에서, 실루엣의 비율과 균형, 캐릭터 라인의 위치와 중력 방향과의 응력성 등이다. 또 한 시각적 무게 배분과 휠의 비례, 실루엣과 필러의 응력 관계, 지붕 선의 비율 등이다. 자동차 전면의 조형 구성 요소에서 그릴의 실루엣과 전조등 라인 그리고 테셀레이션의 관계와 차체 실루엣의 관계 역시 하측두 영역에서 생성된 되먹임의 구조이다.
자동차 조형을 구성하는 양식에서 H 자동차에서는 「스톰 엣지」의 철학으로 유연한 곡면과 선명한 캐릭터 라인을 제시하였다. 이후 H 자동차는 「센슈어스 스포티니스」의 다이나믹한 테셀레이션과 「캐스캐이딩 그릴」로 역동적 양식을 제시하였다. 디자이너들이 경험한 역동성은 2차원 다양체에 투영된 비정규 테설레이션의 응력 특성이다.
이러한 H 자동차의 양식은 이들의 모델을 경험하며 소비자의 전두극에 기억되어 구분할 수 있게 한다. 전두극의 양식 기억은 몬드리안의 회화처럼 모습은 잘 떠오르지 않지만, 그 양식은 선명하게 떠올릴 수 있다. 전두극이 기억하는 몬드리안 회화는 색상과 선 두께 같은 모양이 아니라, 사각형 색 면이 수직과 수평선 속에 배열된 구조이다. 즉, 암묵 기억인 검은 수직 수평선과 적, 청, 황, 흑백 색 면의 위치 관계가 양식으로 구성되어 이를 떠올리게 된다. 단지 전두극에 저장된 시각 요소들 사이 응력 구조의 양식 기억을 의식 영역에 불러와 이를 재현할 수 있다. 모이랑의 유형 인지 의미와 같이 전두극의 양식 의미는 의식으로 떠올릴 수 있는 첫 명시 영역이다. 이것을 실제 이미지와 대비해 정리한 것이 Table 4이다.
| Intelligent region | Function | |
|---|---|---|
| BA 38 | Hood tilt - perceptual stress pattern |
|
| BA 37 | Grille & driving form perception |
|
| BA 20 | ||
| BA 39 | Sensory stimuli integration |
|
| BA 10 | Authority perception from object appearance |
|
표에서와 같이 측두극(BA 38)은 모이랑(BA 39)과 달리, 순수한 지각 층위 시각 자극에서 추출한 요소들의 관계 구조를 양식으로 기억한다. 또한 전두극에는 중측두(MTG) 경로를 지나며, 사실의 응력 구조같이 고차원 추상 의미가 전달돼 결합한다. 여기에는 동력학적 질량 특성, 중력에 안정적인 방향 그리고 중력에 불안정한 경사, 공간의 거주성 등이 포함된다. 이렇게 전달되는 의미는 기울기의 방향성, 낮은 캐릭터 라인의 안정성, 이질 재료가 접합한 모서리 등이다.
또한 낮게 경사진 후드와 높은 트렁크의 역학적 쏠림 같은 응력 관계의 고차 시각 의미가 처리된다. 스포츠카의 후드가 세단보다 더 경사진 이유는 공기역학적 기능뿐만이 아닌 BA 38 영역에 양식으로 생성된 응력 감성을 만족시키기 때문이다. 이를 다시 몬드리안 회화로 보면, 수직선과 수평선으로 구성된 정적인 응력 단순화에 의한 유창성의 호감이다. 몬드리안이 추구한 미의식이 단순함의 유창성인 반면, 동적인 자동차 조형에는 더 복잡한 응력의 상호 결합이 미의식으로 추구된다.
BA 10은 이렇게 처리된 시각 정보에 전전두피질과 안와상피질의 감정과 인식 기억을 더 해, 자동차의 조형 가치를 넘어서는 사회적 권위를 표상하는 대상으로 인지한다. 이런 관점에서 두뇌는 자동차의 모습과 의미를 처리에 참여하는 여러 하위 신경 지능 집합이다.
2024년 노벨 물리학상의 수상자는 컴퓨터학자이며 인지학자인 제프리 힌턴이다. 그는 2012년 시지각을 모방한 합성곱 신경망인 AlexNet로 ILSVRC의 이미지 구분대회에서 우승하며 인공 지능 시대를 열었다. 심층 신경망으로 심화 학습(Deep learning)된 인공 지능은, 알파고 같이 각의 분야에서 인간의 지적 활동을 넘어서고 있다. 힌턴의 지적 분신인 '인공 지능'의 업적을 대리해 노벨물리학상을 받는 초유의 컴퓨터, 인지학자가 되었다. 신경망을 모방한 인공 지능의 출현 이후 불과 12년 만에 일어난 엄청난 변화를 반영한 시상이다.
인공 지능과 협업(Copilot)해 자동차 디자인 과제를 해결할 가능성에서도 지수적 발전을 보여주고 있다. 특히 이미지 생성 AI의 발전 속도는 놀라울 정도여서, 디자인의 새로운 가능성을 기대하게 한다. 대량의 데이터를 학습한 IGA가 소비자의 조형 감성을 인지하는 능력은 디자이너를 넘어선다. 또한 자동차 디자인 솜씨와 자동차 의미의 인지적 상상 역시 이미 디자이너를 넘어선다. 다만 인공 지능은 디자이너의 인식적 상상 즉, 생각의 신경활동에는 아직 못 미친다. 이런 AI 환경에서 디자이너는 자신의 조형 의도를 인식하고 이를 담은 언어로 IGA를 제어해야 한다.
본 연구는 이 가능성을 탐구하기 위해 먼저 인공 지능(AGI)의 학습 구조를 살펴보았다. 그 결과 AI에 임베드된 특징과 의미 벡터가 소비자의 신경 활동에 사상된 미의식과 대칭임을 확신할 수 있었다. AI와 두뇌가 사실의 모습과 의미를 학습한 구조의 대칭성을 바탕으로, 소비자의 미의식을 신경학에 기반해 해석했다. 이러한 해석을 통해 조형의 생성 구조 언어와 자동차 디자인의 양식 언어 그리고 소비자 인지 언어의 연결 가능성을 볼 수 있었다. 이를 통해 조형의 생성 구조와 이를 사상한 신경 지능 그리고 조형 언어와 그 언어로 서술한 자동차 조형의 모습 사이 대칭성을 확인하였다. 인공 지능과 Copilot으로 디자인 과제를 해결하는데, 인공 지능과 신경 지능 사이 대칭성을 이해하는 것이 도움이 되리라 기대한다.
| 1. | A. Radford, J. W. Kim, C. Hallacy, A. Ramesh, G. Goh, S. Agarwal, G. Sastry, A. Askell, P. Mishkin, J. Clark, G. Krueger and I. Sutskever, “Learning Transferable Visual Models from Natural Language Supervision,” International Conference on Machine Learning, pp.8748–8763, 2021. |
| 2. | A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, Ł. Kaiser and I. Polosukhin, “Attention Is All You Need,” Advances in Neural Information Processing Systems, 30, 2017. |
| 3. | J. A. Hirsch and L. M. Martinez, “Laminar Processing in the Visual Cortical Column,” Current Opinion in Neurobiology, Vol.16, No.4, pp.377–384, 2006.![]() |
| 4. | J. Hawkins, “A Thousand Brains: A New Theory of Intelligence,” Basic Books, 2021. |
| 5. | Y. E. Hwang, Y. B. Kim and Y. D. Son, “Finding Cortical Subregions Regarding the Dorsal Language Pathway Based on the Structural Connectivity,” Frontiers in Human Neuroscience, Vol.16, Paper No.784340, 2022.![]() |