From: Anatole ( MedyntsevA@Novavox.ru ) Date: 11:20:41 16/02/01
Posted-From: 195.201.56.225
Привет всем!
Тут наткнулся в своем архиве на такие заметки...
Как распознавать образы из линий.
(заметки)
1. Моделируем глаз с мышцами.
Глаз двигается по линии.
Чтобы двигать глаз по линии необходимо напрягать
соответсвующие мышцы. Вектор напряжений определяет
направление линий.
Система обладает инерционностью.
Если дошли до конца линии нужно резко затормозить это
требует действия мышцы в противоположном направлении.
Плавные переходы получаются если мы не тормозя некоторое
направление, но прекратив воздействие начинаем напрягать
еще одну мышцу в другом направлении. (за счет инерции
получаем то что надо)
Таким образом каждый образ кодируется последовательностью
векторов напряжений. Моменты изменения векторов
напряжений образуют некоторый ритм, определяемый временем
действия векторов напряжений. Ритмические рисунки
(аналог музыкальных фраз) не очень много и длина их не
очень велика. Гипотеза состоит в в том, что ритмический
рисунок описывает ритм "фразы" распознавания, причем
имеется дикретизация ритма по степеням 2. Ритмический
рисунок, полученный при сканировании, сопоставляется с
одним из стандартных ритмических рисунков. Т.е. если ритм
не совпадает в точности мы выбираем тот рисунок, который
наиболее похож.
То есть каждый об'ект определяется вектором
напряжеий и одним из стандартных ритмических рисунков
(его номером). Об'екты, ритмический рисунок которых
длиннее базовой величины рассматриваются как составные
об'ектов и процесс их распознавания более сложен. Буквы
по-видимому обладают элементарным ритмическим рисунком.
Таким образом мы должны выделить набор векторов и
ритмический рисунок, определяющий пропорции между
длительностями. Обычно, длительности квантуются в 2 раза
(музыка). Ритмический рисунок - соотношение между
длительностями, а не абсолютные длительности, что
обеспечивает инвариантность относительно размеров. При небольшом
количестве мышц удобно использовать нотную нотацию для
записи образа (высота тона-номер мышцы; длительность
определяет ритм).
Можно предположить, что используется два
ритмических рисунка. Один - ритм жестких остановок, т.е.
если линия кончилась - мы тормозим напрягая все мышцы
одновременно. Другой - ритм изменений векторов направлений.
Вопрос: Какие ритмические последовательности распознает
человек? Их максимальная длина? (можно предположить, что не
более 8.)
Выбор направления, в котором необходимо двигаться дальше
определяется дрожанием зрачка. Зрачок все время
осуществляет пробные попытки. Если несколько
пробных направлений успешны то мы двигаемся по тому же
направлению, что и раньше.
Если есть два возможных направления движения, то мы
выбираем один, тот, который в большей степени совпадает
(или может быть в точности совпадает) с текущим
направлением.
(Еще одна гипотеза).
2. Как кодируется скорость движения (для рук и
всего остального - также).
Если это рычаг типа рук, то мышцы прикрепляются в разных
точках.
Мы можем описать с какой скоростью тянуть, указывая номер
тяжа, за который необходимо тянуть. Номер кодируется
аналогично кодировке направления движения глаз. А именно,
вектором, в котором биты установлены, в тех позциях,
которые соответствуют номеру тяжа. Реальная сила,
c которой мышца должна работать определяется самой
мышцой. Cжатие мышцы происходит всегда с одной скоростью.
Она должна сжиматься с такой силой, чтобы обеспечить
постоянную величину этой скорости, независимо от нагрузки.
Анатолий Медынцев