Факторне моделювання на базі методу Верле

Метод Верле – це ітераційний метод обчислення наступного місцезнаходження матеріальної точки по поточному та минулому местоположениям з урахуванням накладених зв'язків усередині системи точок.

Пружна структура – це найбільш загальний вигляд структур для апроксимації даних. Це набір вузлів і пружних зв'язків між ними. В якості таких зв'язків можуть виступати пружинна зв'язок між парою точок з рівноважним відстанню між точками і ребра жорсткості трійки вузлів з рівноважним кутом між вузлами. Для апроксимації набору точок пружною структурою пропонується використовувати фізичну інтерпретацію точок даних як центрів, що притягують вузли пружної структури. Приватним випадком пружної структури є нелінійні головні компоненти. Це набір пружних ланцюжків з загальною точкою перетину. При великій жорсткості пружних зв'язків нелінійні головні компоненти переходять у класичні головні компоненти факторного аналізу. Для розрахунку руху точок пружної структури в полі тяжіння і врахування зв'язків між вузлами пружної структури пропонується використовувати метод чисельного інтегрування Верле.

Багатовимірне шкалювання дозволяє в рамках гіпотези про розмірності цільового простору розташувати об'єкти за їх взаємною відстаням таким чином, щоб відновлювані відстані між об'єктами наближалися до емпіричним. На базі методу Верле пропонується здійснити багатовимірне шкалювання, тим самим взаємні відстані між точками будуть враховані з найбільшою точністю. В якості матриці взаємних відстаней буде виступати матриця кореляцій. За допомогою багатовимірного шкалювання буде здійснена факторизація кореляційної матриці, тим самим буде відновлена факторна структура даних у факторному просторі. Щоб отримати интерпретабельное рішення пропонується використовувати окремі методи факторного обертання, застосовані до відновленої факторної структури.

1. Метод Верле
Алгоритм Верле використовується для обчислення наступного положення точки з поточного та минулого:

– обчислювані координати j-ой точки на i-ой ітерації, m – розмірність простору, – вектор швидкості j-ой точки.

– вектор впливу k-го центру тяжіння, представленого точкою даних , j-шу точку,
.

На систему точок накладаються обмеження: деякі з точок пов'язані пружними стрижнями заданої довжини.

Алгоритм працює наступним чином:

  • 1. Обчислюються нові положення точок.
  • 2. Для кожної зв'язку задовольняється відповідне умова.
  • 3. Крок 2 повторюється s разів.
Наприклад, s = 16.

Процедура релаксації зв'язку описується наступними формулами:

Якщо зв'язок представлена точками з рівноважним відстанню між ними
,
,
,
– коефіцієнт пружності зв'язку,

– коефіцієнт, що залежить від числа s повторень кроку 2.


Рис. 1. Пружинна зв'язок пари точок з рівноважним відстанню

Трійки вузлів можуть утворювати ребра жорсткості з рівноважним кутом. Такі зв'язки пропонується емулювати зв'язками у вигляді пружних стрижнів між крайніми точками. Рівноважний відстань між крайніми точками при цьому визначається з рівності трикутника. Якщо зв'язок представлена точками c рівноважним кутом , тоді рівноважний відстань між точками і обчислюється за формулою:

.


Рис. 2. Ребро жорсткості трійки точок з рівноважним кутом

2. Багатовимірне шкалювання
Багатовимірне шкалювання (МНШ) — це спосіб найбільш ефективного розміщення об'єктів, наближено зберігає спостерігаються між ними відстані. МНШ розміщує об'єкти в просторі заданої розмірності і перевіряє, наскільки точно отримана конфігурація зберігає відстані між об'єктами. МНШ використовує алгоритм мінімізації деякої функції, яка оцінює якість одержуваних варіантів відображення.

Заходом, найбільш часто використовується для оцінки якості підгонки моделі (відображення), вимірюваного за ступенем відтворення вихідної матриці схожості, є так званий стрес. Величина стресу φ для поточної конфігурації визначається так:

.

Тут dij − відтворені відстані в просторі заданої розмірності, а δij − вихідне відстань. m – кількість об'єктів. Функція f(δij) позначає неметрическое монотонне перетворення вихідних даних (відстаней). МНШ відтворює не кількісні міри схожості об'єктів, а лише їх відносний порядок. Чим менше значення стресу, тим краще матриця вихідних відстаней узгоджується з матрицею результуючих відстаней.

3. Головні компоненти та факторна модель
Модель головних компонент описується наступними формулами:


m – число змінних,
g – число факторів,
− вихідні змінні,
− загальні фактори,
− специфічні фактори.

4. Пружна факторна структура
В якості системи точок для методу Верле може бути використана координатна система, представлена осями ,
, де
w – число точок, які утворюють факторну вісь,
,
g – кількість факторних осей.

Наприклад при (число w має бути непарною більшим 1)



l – відстань між парою сусідніх точок, що утворюють факторну вісь.

– індекс центральної точки факторної осі.

Пари точок утворюють зв'язок з рівноважним відстанню l.

Пари точок утворюють зв'язок з рівноважним відстанню .

Всі пари точок різних осей i j утворюють зв'язок з нульовим рівноважним відстанню.

Пари точок різних осей i j утворюють зв'язок з рівноважним відстанню, рівним початковому відстані між точками. Ці зв'язки задають прямі кути між різними факторними осями i j. Іншим способом завдання ортогональною факторної структури є додавання ребер жорсткості з прямим рівноважним кутом між трійками точок між різними факторними осями i j.


Рис. 3. Способи завдання факторної структури для методу Верле

Елементи факторної структури можуть бути визначені як коефіцієнт кореляції між j-ой факторної віссю і i-ой віссю вихідної системи координат:

,
,
– символ Кронекера,
– вектор напрямку j-ой факторної осі.

5. Пружна структура багатовимірного шкалювання
Кореляції між вихідними змінними можуть бути визначені як скалярний добуток нормалізованих останніх з нульовим середнім і одиничною дисперсією:



n – розмірність вихідного простору змінних.

Коефіцієнти кореляцій між вихідними змінними визначають матрицю кореляцій, схожу з матрицею взаємних відстаней методу багатовимірного шкалювання. Оскільки ближнім об'єктів у факторному просторі відповідають великі значення коефіцієнтів кореляцій, то елементи матриці взаємних відстаней dij виходять з відповідних елементів матриці кореляцій rij за формулою:

.

За допомогою методу Верле буде відновлена факторна структура в рамках гіпотези про розмірності g факторного простору.

Елементи факторної структури можуть бути визначені як коефіцієнт кореляції між j-ой факторної віссю і i-ої змінної:

,
,
– символ Кронекера,
– вектор напрямку j-ої змінної у факторному просторі.
j-а змінна у факторному просторі.
– центр мас факторної структури змінних у факторному просторі.


Рис. 4. Пружна структура багатовимірного шкалювання

6. Програмна реалізація
Метод Верле був реалізований програмно з використанням загальнодоступної бібліотеки JavaScript Verlet.js, яка була вдосконалена для багатовимірного випадку. Web додаток факторного аналізу за методом розрахунку пружної факторної структури і багатовимірного шкалювання на базі методу Верле доступний за адресами http://svlaboratory.org/application/pca і http://svlaboratory.org/application/multscal після реєстрації нового користувача. Додаток дозволяє візуалізувати процес збіжності методу Верле в заданій площині координат (рис. 5).


Рис. 5. Візуалізація методу Верле в web додатку

Висновок
В якості пружної структури була використана багатовимірна факторна структура, що містить факторні осі і зв'язки між різними точками факторних осей. Для апроксимації набору точок пружною структурою був використаний метод Верле та фізична інтерпретація точок даних у багатовимірному просторі як центри тяжіння. Метод багатовимірного шкалювання на базі методу Верле, применный до кореляційної матриці, є альтернативним методом факторизації. Як багатовимірної пружної структури може бути використана довільна структура, тим самим запропонований метод апроксимації на базі методу Верле має узагальнений характер.
Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.