Нейросимволический подход к преодолению когнитивного разрыва между языковыми моделями и физическим миром CAD-проектирования. Как собственный язык TCSL v1.5 с размерной типизацией, многоуровневая валидация и интеграция с FreeCAD решают фундаментальные ограничения трансформеров.
К марту 2026 года индустрия автоматизированного проектирования переживает один из самых парадоксальных периодов в своей истории. С одной стороны, большие языковые модели — GPT-5.4, Gemini 3.1 Pro, Claude 4.6 Sonnet — достигли беспрецедентного уровня в генерации программного кода, прохождении инженерных экзаменов и формулировании технических спецификаций. С другой стороны, эти же модели систематически путают миллиметры с градусами, генерируют физически невозможные объекты и предлагают конструкции, которые разрушатся под собственным весом.
Этот фундаментальный разрыв между лингвистической компетенцией и пространственным пониманием описывается исследователями как «пространственная слепота» — структурное ограничение архитектуры трансформеров, а не временный программный дефект.
На фоне этого кризиса российская платформа TextToCAD (texttocad.ru) предлагает принципиально иной подход к интеграции ИИ в CAD-проектирование. Вместо попыток заставить языковую модель «понимать» физику — что, как показывают исследования, невозможно в рамках текущей парадигмы — TextToCAD выстраивает многоуровневую нейросимволическую архитектуру, в которой вероятностная природа LLM жёстко контролируется детерминированными валидаторами, собственным специализированным языком TCSL и интеграцией с геометрическим ядром FreeCAD.
Настоящая статья анализирует, каким образом TextToCAD решает каждую из ключевых проблем, выявленных в фундаментальных исследованиях пространственной слепоты LLM, и оценивает предложенную архитектуру с позиции инженерной практики.
Фундаментальная причина несостоятельности LLM в инженерном проектировании кроется в самом механизме обработки информации. Алгоритм Byte-Pair Encoding (BPE), лежащий в основе токенизации всех современных трансформеров, разбивает входные данные на дискретные фрагменты на основе частоты их встречаемости в обучающем корпусе. Число 10.5mm может быть разделено на токены 10, ., 5 и mm — четыре независимых вектора в многомерном пространстве, лишённых математической связи. Для модели, оперирующей статистическими закономерностями текста, фразы «длина 90 мм» и «угол 90 градусов» неразличимы, поскольку встречаются в идентичных синтаксических структурах технической документации с сопоставимой частотой.
Масштаб модели не конвертируется в пространственный интеллект. При тестировании современных 3D-LLM на задачах пространственного понимания (март 2026) точность резко падает при переходе от лингвистических к геометрическим задачам.
LLM обучаются на текстах, которые описывают мир, но не взаимодействуют с ним физически. Модели обладают тем, что исследователи называют «текстурой экспертного дискурса»: они используют профессиональные термины — «изгибающий момент», «сопротивление материалов», «концентраторы напряжений» — но за этими словами не стоит понимания физической сути.
Тестирование пограничных моделей (Gemini 2.5 Pro, GPT-4o, Claude 3.7) на задачах планирования механической обработки латунной детали выявило систематические ошибки, которые привели бы к поломке инструмента или травме оператора: абсурдная фиксация заготовки, игнорирование жёсткости и вибрации, коллизии инструмента с зажимным приспособлением.
Ошибки LLM в CAD-проектировании имеют прямое материальное воплощение. В промышленности стоимость исправления инженерной ошибки возрастает в геометрической прогрессии на каждом этапе жизненного цикла изделия.
Из-за ошибки ИИ в интерпретации размерности (потеря десятичной точки) завод заказал стальные листы толщиной 15 мм вместо требуемых 1.5 мм — прямые убытки $23 000 плюс двухнедельная задержка производства.
Средняя стоимость производственного сбоя, связанного с некорректными CAD-файлами, в промышленном секторе достигает $6.98 млн CAD.
Нейросимволический подход: LLM как интерфейс, а не конструктор
TextToCAD принимает ключевой вывод исследований 2026 года: языковые модели не могут и не должны быть CAD-системами. Вместо этого платформа реализует нейросимволическую парадигму, в которой роли чётко разделены: LLM выступает исключительно как «переводчик» намерений пользователя в структурированный код, а вся ответственность за физическую корректность и геометрическую целостность лежит на детерминированных математических модулях.
Формулирует задачу на естественном языке
Claude, GPT, GigaChat, YandexGPT, DeepSeek, Gemini, Ollama
Многоуровневая проверка до исполнения
Геометрическая корректность на OpenCascade
Замкнутый цикл: ошибка на любом этапе → отчёт возвращается LLM для итеративного исправления
Этот цикл соответствует концепции «Solver-in-the-loop», которую исследовательское сообщество в 2026 году признаёт наиболее перспективным подходом к интеграции ИИ в инженерные системы.
LLM создаёт Python-скрипт с вызовами Part.makeBox, Part.makeCylinder, булевыми операциями, трансформациями и специализированными функциями (create_tube, drill_hole).
Собственный декларативный язык платформы, спроектированный специально для преодоления ограничений LLM при генерации геометрии. Размерная типизация, статическая верификация, зонная структура.
Первый и, возможно, самый важный принцип TCSL напрямую атакует корневую причину путаницы миллиметров с градусами. В TCSL число без единицы измерения является синтаксической ошибкой на уровне грамматики: запись 100 не является длиной — только 100 mm имеет тип Length.
let inner_w = width - 2 * board
# 732 mm - 2 × 16 mm = 700 mm ✓
let bad = width + angle
# 732 mm + 45 deg = ??? ОШИБКА
# R001: Incompatible dimensions
Исследования 2026 года предлагают аналогичный подход — «принудительное оборачивание числовых значений в строго типизированные классы: Length(90) versus Angle(90)» — как одну из ключевых стратегий преодоления пространственной слепоты. TCSL реализует эту стратегию на уровне всего языка, а не отдельной библиотеки.
Базовые параметры. Слайдеры Viewer.
Формулы. Автопересчёт.
Конструкторы + конвейер. Арифметика запрещена.
Именование деталей. Калькулятор.
Переход между зонами необратим — появление инструкции из более ранней зоны после перехода в более позднюю генерирует ошибку E005. Это решение элегантно адресует сразу три проблемы, выявленные в исследованиях:
В универсальном Python LLM может перемежать определение параметров, операции и арифметику. В TCSL это физически невозможно.
LLM часто генерируют хаотичный набор команд. Четырёхзонная структура делает код линейным и предсказуемым.
TCSL запрещает функции, условия, циклы — каждая конструкция расширяет пространство состояний для ошибки LLM.
rounded = top |> select_edges_by_axis(axis = Z) |> fillet(radius = 3 mm)
Типовая совместимость конвейера контролируется статически: Geometry может быть передана в translate, rotate, scale, select_*, union, cut; EdgeSet — только в fillet и chamfer; FaceSet — только в shell. Нарушение вызывает ошибку R003.
shelf = box(width = total_w - 2 * board, depth = d, height = board)
inner_w = total_w - 2 * board
# E002: Expected function call
Это решение устраняет класс ошибок, при которых LLM обновляет базовый параметр, но «забывает» пересчитать зависимый — в TCSL зависимые параметры являются формулами, а не числами.
Исследования 2026 года фиксируют критический разрыв между генерацией 3D-модели и её производственной реализацией. TextToCAD преодолевает этот разрыв через интегрированный модуль ценообразования TextToCAD Price, который автоматически извлекает спецификацию материалов (BOM) из сгенерированной 3D-модели и формирует детализированное коммерческое предложение.
# Формат: [Элемент]_[Материал][Толщина]_[Номер]
export corpus_left as Side_PB16mm_1 # → Chipboard 16 мм, расчёт по м²
export back_panel as BackPanel_HDF3mm_1 # → HDF 3 мм, расчёт по м²
export tube_post as Post_Tube40x40x2_1 # → Профтруба 40×40×2, расчёт по м.п.
export guide_l as Hardware_1 # → Фурнитура, расчёт по шт.
Запрос: «навес 6×4 м, труба 80×80×3, поликарбонат 8 мм»
Трёхкратный разброс, состав цены не раскрыт
Тот же запрос
Детализация на 15–20 позиций: каждая труба, сварной шов, покраска, крепёж
Парсер TCSL, реализованный на стандартной библиотеке Python 3.11+ без внешних зависимостей, выполняет 30 из 32 проверок спецификации: лексический анализ, синтаксическая структура, порядок зон, размерная алгебра, совместимость типов в конвейере, арность булевых операций, уникальность экспорта, позитивность параметров конструкторов, целочисленность счётчиков, деление на ноль.
Только две проверки требуют исполнения: пустой результат селектора (R005) и несовпадение типа при runtime-переопределении input (R006).
TextToCAD реализует четырёхэтапную стратегию генерации кода, которая напрямую адресует проблему «усталости контекста» LLM — документированное явление, при котором качество генерируемого кода падает к концу длинного скрипта.
Типы Length и Angle живут на разных осях размерной системы. Попытка сложить их генерирует ошибку R001. Это не рекомендация — это синтаксическая невозможность, верифицируемая формальным автоматом за миллисекунды.
Функция drill_hole принимает направление как строковую константу ("Z", "X_NEG"), а не числовой угол. Это устраняет класс ошибок, при которых LLM путает угол поворота цилиндра с линейным смещением.
Абсолютный запрет: Никогда не использовать cylinder + rotate для крепежа. Использовать box с соответствующей ориентацией.
TextToCAD не пытается заставить LLM «понимать» граничное представление (B-Rep). Вместо этого LLM генерирует высокоуровневые команды (box, cylinder, cut, fuse, translate), а ядро FreeCAD (построенное на OpenCascade) выполняет все B-Rep операции: расчёт пересечений, конструктивную блочную геометрию, проверку замкнутости объёмов.
Для корпусной мебели TextToCAD внедряет обязательную проверку непротиворечивости высотных отметок: сумма всех секций и толщин панелей должна равняться высоте боковин с точностью до зазоров. Если расхождение превышает 15 мм — генерация блокируется. Эта проверка непосредственно адресует задокументированную проблему «геометрического дрейфа», при которой авторегрессионное накопление ошибок токенизации приводит к нестыковке элементов конструкций.
Исследования 2026 года выделяют «предвзятость автоматизации» (Automation bias) как ключевой фактор, превращающий теоретические ограничения LLM в реальные производственные катастрофы. Когда инженер получает визуально безупречную 3D-модель, его критическое мышление притупляется. TextToCAD противодействует этому через архитектурное решение: каждый шаг генерации прозрачен и верифицируем.
# Финальная валидация — отчёт по каждой детали:
OK: Side_PB16mm_1 | 16.0 × 500.0 × 900.0 | Vol=7200000.0
OK: Side_PB16mm_2 | 16.0 × 500.0 × 900.0 | Vol=7200000.0
OK: Top_PB16mm_1 | 800.0 × 500.0 × 16.0 | Vol=6400000.0
OK: Bottom_PB16mm_1 | 768.0 × 480.0 × 16.0 | Vol=5898240.0
OK: BackPanel_HDF3mm_1| 768.0 × 3.0 × 872.0 | Vol=2009088.0
# 5/5 объектов прошли проверку ✓
TCSL спроектирован так, чтобы его код читался как спецификация изделия. Имена переменных обязаны быть описательными (corpus_left_side, drawer_bot_wall_left — допустимы; a, b, tmp — запрещены). Программу на TCSL можно показать коллеге, не знакомому с языком, и он поймёт, что описано.
Манифест TCSL декларирует язык как «индустриально-нейтральный». Ядро языка — грамматика, система типов, размерная алгебра, зонная структура, парсер — не содержит отраслевой специфики. Вся специфика инкапсулирована в подключаемых модулях: библиотеки конструкторов, наборы производственных правил и шаблоны именования для экспорта.
Каркасы, лестницы, навесы. Библиотека профилей по ГОСТ.
Шкафы, комоды, тумбы. Полный цикл от параметров до крепежа.
Витрины, гондолы, ресепшены, примерочные.
Развёртки, лазер, раскрой.
SLA/DLP, оптимизация, поддержки, экспорт 3MF.
8 уровней параметрической модели. Перспективный сегмент.
Каркасный дом декомпозируется на восемь уровней параметрической модели: габариты и планировка, фундамент, каркас и стены, перекрытия, кровля, окна и двери, инженерия, отделка. Грамматика, система типов и парсер остаются неизменными — добавляются только новые конструкторы и производственные правила.
| Критерий | «Чистые» LLM-генераторы | Крупные CAD-платформы | Исследовательские DSL | TextToCAD |
|---|---|---|---|---|
| Валидация до исполнения | Нет | Частичная | Частичная | 30 проверок, 94% |
| Размерная типизация | Нет | Нет | Библиотека | Уровень грамматики |
| Открытое ядро | Зависит | Проприетарное | Открытое | FreeCAD / OpenCascade |
| Цикл до КП в PDF | Нет | Отдельные модули | Нет | Полный цикл |
| Локальные LLM | Облако | Облако | Зависит | Ollama |
| Требуемая ручная правка | ~82% | ~40% | ~30% | Минимальная |
TCSL намеренно запрещает пользовательские функции, условные конструкции, циклы и вложенные блоки. Описание изделия со сложной условной логикой невозможно в одном файле TCSL. Решение — использование Python-конвейера для сложных задач.
Для запросов типов C и D точность назначенных размеров ограничена стандартными эргономическими таблицами и пропорциями — с точностью ±15 мм. Система документирует это ограничение и запрашивает подтверждение.
Парсер TCSL работает без GPU и без CAD-системы, но финальная валидация геометрии требует FreeCAD. Веб-модуль ценообразования может работать автономно.
Проблема пространственной слепоты LLM — это не временный дефект, который будет исправлен в следующей версии GPT или Claude. Это фундаментальное ограничение архитектуры, основанной на предсказании следующего токена в текстовой последовательности. Для трансформера числа «90 мм» и «90 градусов» — близкие статистические сущности, а самопересекающийся полигон синтаксически неотличим от корректного тела.
TextToCAD (texttocad.ru) предлагает архитектурный ответ на эту проблему, а не попытку её «обойти». Платформа реализует нейросимволическую парадигму, в которой каждый участник цепочки делает то, что умеет лучше всего: LLM переводит намерения пользователя в структурированный код, собственный язык TCSL с размерной типизацией блокирует класс ошибок на уровне грамматики, многоуровневый валидатор перехватывает 94% ошибок до исполнения, геометрическое ядро FreeCAD/OpenCascade гарантирует топологическую корректность, а модуль ценообразования замыкает цикл от текста до коммерческого предложения.
«Язык, который может описать всё, не может гарантировать ничего. Язык, который описывает ровно то, что нужно, гарантирует ровно то, что обещает.»
— Манифест TCSL v1.0
В контексте исследований марта 2026 года TextToCAD представляет собой практическую реализацию подхода, который академическое сообщество только начинает формулировать теоретически: вместо наращивания параметров универсальных моделей — создание специализированных нейросимволических систем, где вероятностная природа нейронных сетей жёстко контролируется детерминированными математическими ядрами. Это не компромисс, а архитектурная необходимость: проектирование физических объектов требует точности, которая в парадигме чистых LLM является статистической случайностью, а в парадигме TextToCAD — гарантированным свойством системы.
Первый систематический обзор на пересечении LLM и CAD. Охватывает таксономию из шести ключевых направлений применения языковых моделей в автоматизированном проектировании, от генерации 3D-моделей до интерпретации чертежей.
arxiv.org/html/2505.08137v2Фреймворк генерации CAD на основе LLM с pointer-механизмом для выбора геометрических сущностей (рёбра, грани). Решает проблему топологических ошибок квантизации в командных последовательностях B-Rep.
arxiv.org/html/2603.04337v1Демонстрирует, что текстовая модель без 3D-входа может превзойти 3D-LLM на бенчмарке SQA3D. Вводит Real-3DQA — строгий бенчмарк, показывающий провал существующих 3D-LLM в пространственном рассуждении при удалении текстовых подсказок.
arxiv.org/html/2603.23523v1Мультиагентный конвейер генерации CadQuery-кода с двойным циклом коррекции: внутренний — ошибки исполнения, внешний — программная валидация геометрии через ядро OpenCASCADE. Снижает Chamfer Distance с 28.37 до 0.74.
arxiv.org/html/2603.26512v1Представляет архитектуру SYNAPSE: нейросимволический подход, где LLM обрабатывает естественный язык, а детерминированное ядро (Code Aster) выполняет расчёты по Еврокодам. Демонстрирует 94% точности в реальном чат-боте 3Muri для строительных конструкций.
mdpi.com/2075-5309/16/3/534Предлагает CAD-Tokenizer — VQ-VAE-фреймворк с пулингом на уровне примитивов. Показывает, что стандартные BPE-токенизаторы LLM разрушают CAD-семантику, и специализированная токенизация значительно улучшает генерацию и редактирование 3D-моделей по текстовым инструкциям.
arxiv.org/html/2509.21150v2Вводит AIDL — иерархический DSL с солвером-помощником, спроектированный под сильные стороны LLM. Позволяет генерировать параметрический CAD через zero-shot промпты, превосходя OpenSCAD по интерпретируемости и редактируемости.
onlinelibrary.wiley.com/doi/10.1111/cgf.70250Предлагает генерировать CadQuery-код напрямую из текста, используя дотренированные LLM на Python. Показывает 69.3% exact match и снижение Chamfer Distance на 48.6% — без промежуточных представлений, опираясь на встроенное знание Python у LLM.
arxiv.org/html/2505.06507v1Обзор бенчмарка SURPRISE3D от MBZUAI: 200 000+ пар запросов и масок, 900+ сцен. Показывает, что точность 3D-LLM падает до ~5% на задачах пространственного рассуждения, если убрать имена объектов — модели эксплуатируют текстовые шорткаты, а не понимают геометрию.
mbzuai.ac.ae/news/…Детальный кейс-стади обработки латунной детали: все протестированные пограничные модели (GPT-4o, Claude 3.7, Gemini 2.5 Pro, o3) систематически ошибаются в планировании фиксации заготовки, выборе инструмента и последовательности операций — с потенциальными травмами оператора.
lesswrong.com/posts/…Статья WEF о нейросимволическом ИИ: объединение логики, правил и каузальных структур с нейросетями позволяет устранить галлюцинации и обеспечить аудируемость результатов. Аргументирует, что будущее надёжного ИИ — в гибридных архитектурах.
weforum.org/stories/…Прогноз исследовательского подразделения Autodesk о будущем ИИ в проектировании и производстве. Фиксирует разрыв между языковым интеллектом моделей и их неспособностью работать с физическим миром без детерминированных валидаторов.
research.autodesk.com/blog/…Отчёт Центра безопасности и новых технологий Джорджтаунского университета: автоматизация ИИ приводит к тому, что квалифицированные операторы перестают проверять результаты, что в инженерных контекстах создаёт каскадные отказы.
cset.georgetown.edu/publication/…Пять реальных сценариев ошибок в спецификациях материалов (BOM): от неверных толщин до пропущенных крепёжных элементов. Демонстрирует экспоненциальный рост стоимости ошибки на каждом этапе — от проектирования к производству.
cadtalk.com/the-real-cost-of-bom-errors/…Исследование стоимости переделок в строительстве на данных из 17 стран: переделки составляют 2–20% бюджета проекта. До 70% переделок вызваны ошибками проектирования — прямой аргумент в пользу валидации CAD-файлов до производства.
planradar.com/us/cost-of-rework-construction/Платформа нейросимволического CAD-проектирования: текст → 3D-модель → BOM → PDF-коммерческое предложение. Поддержка 7+ LLM, включая локальные через Ollama.
texttocad.ruПерсональный сайт автора и архитектора платформы TextToCAD. Портфолио проектов в области CAD, AI и промышленной автоматизации.
fedorko.ruПолная спецификация языка TCSL: грамматика, система размерных типов (Length, Angle, Area, Volume), четырёхзонная архитектура (INPUT → LET → GEOMETRY → EXPORT), 32 типа ошибок.
Философский документ, обосновывающий принципы TCSL: индустриальная нейтральность, запрет Тьюринг-полных конструкций, «язык, который описывает ровно то, что нужно, гарантирует ровно то, что обещает».
Инструкция для системных промптов: как LLM должна генерировать TCSL-код с учётом зонной структуры, размерной типизации и запретов на голую арифметику в зоне геометрии.
Правила генерации Python-скриптов для конвейера FreeCAD: разрешённые и запрещённые функции, формат doc.addObject, четырёхэтапная генерация, проверка Z-уровней для корпусной мебели.
Описание текущей архитектуры платформы: два конвейера генерации (Python/FreeCAD и TCSL), 7+ поддерживаемых LLM-провайдеров, модуль ценообразования TextToCAD Price.
Проектный документ расширения модуля ценообразования на сегмент каркасного домостроения: 8 уровней параметрической модели, от фундамента до кровли, с интеграцией ГОСТ-профилей и климатических зон.
78% B2B-клиентов покупают у первого. TextToCAD Price — КП с детальной сметой за 60 секунд
Ручной расчёт — 2–5 ч. TextToCAD — 60 сек
Каждая труба, шов, крепёж — с ценой
Менеджер сам. 80% без технолога
Демо на вашем изделии за 15 минут
Статья подготовлена на основе анализа открытых научных публикаций, отраслевых обзоров, технической документации TextToCAD.
Аналитическая статья · Март 2026 · texttocad.ru