[identity profile] ebanat-kaliya.livejournal.com posting in [community profile] useful_faq
Приношу извинения, т.к. я полный дилетант и могу выражаться абсолютно некорректно.
Есть некий экспериментально полученный числовой ряд, который можно расположить на графике.
Задача - понять основную тенденцию графика (т.е. в какую сторону он направлен и насколько "круто завернут" :) )
И все это выразить одним единственным числом.

То, что мне пришло на ум - это как-то привести числовой ряд к степенной функции. Т.е. если степень положительная и больше 1 - график представляет собой гиперболу, направленную в одну сторону, если 1 - то линейная функция, если больше нуля и меньше единицы - пологий скат параболы. 0 - прямая, а отрицательная степень - график направлен в другую сторону.

Понятное дело, что все это очень приблизительно, но большего мне и не надо:)
Реально ли такое сделать и если да, то как? (есть ли какие-о формулы? термины?)

Или я совсем не прав со степенью? Если не прав, то опять же как тогда получить число, дающее такую качественную характеристику графика?

Под катом - картинка
Это я вручную в экселе накидал просто чтоб было наглядно понятно о чем речь идет




UPD: кстати, в экселе есть такая функция "добавить линию тренда"
то, что показывается на графике при выборе "степенная" ее добавлении - меня полностью устраивает
но мне нужно не график увидеть, а получить значение степени этой степенной функции
т.е. фактически понять как, на основании какой формулы эксель строит эту степенную функцию
UPD2: правильно ли я понял, что то, что я ищу называется степенной аппроксимацией?

Date: 2011-06-30 06:24 pm (UTC)
From: [identity profile] karpion.livejournal.com
Степенной ряд высоких степеней на разных своих локальных участках может вести себя совершенно различно. Я не понимаю, что именно Вам надо.

Возможно, Вам достаточно ограничиться линейным или квадратичным рядом. Обычно это решается так:
У нас есть ряд пар X[i] и Y[i] (для Вашего графика X[i]==i).
Мы вводим предполагаемую функцию F(X), которая д.б. близка к этим парам.
Вводим функцию суммарного квадратичного отклонения Q=Sum( (F(X[i]-Y[i])^2 ) по всем i.
Теперь подбираем параметры функции (коэффициенты при степенях X) так, чтобы Q было минимальным.

Для степенного ряда, а также для любого ряда, где вместо степеней выступают функции без параметров, задача после ряда преобразований сводится к решению линейного уравнения.
Поясняю: F(X) = A*EXP(X) + B*TG(X) сводится к линейному уравнению.
F(X) = A*X^B к линейному уравнению не сводится. Можно свести, но Q надо будет вычислять иначе.

PS: А может, Вам хватит корреляции? Почитайте Википедию.

Date: 2011-06-30 06:36 pm (UTC)
ext_472388: (Default)
From: [identity profile] drolya.livejournal.com
Тыкаете в экселе правой кнопкой на свой график, Добавить линию тренда, выбираете тип функции, который считаете наиболее подходящим, во вкладке "Параметры" ставите крыжик на "Показывать уравнение на диаграмме", можно еще R^2 тоже нажать. Вуаля. Если пробовать разные типы графиков, то лучше тот, у которого р-квадрат больше (единица максимум).

Date: 2011-06-30 08:19 pm (UTC)
ext_472388: (Default)
From: [identity profile] drolya.livejournal.com
Ключевые слова "метод наименьших квадратов". Почитать можно учебник эконометрики. На пальцах сложно объяснить.

Date: 2011-06-30 07:10 pm (UTC)
From: [identity profile] aterentiev.livejournal.com
по поводу "насколько круто завернут" - нужна первая производная этой "отфильтрованной" функции тренда

если данных много, я бы сделал плавающее среднее в качестве фильтра (moving average) и ее бы продифференцировал (как простейший вариант производной - разница между значением этого moving average в момент Х и в момент Х-1)

на самом деле, самое важное - выбрать, чем аппроксимировать ваши данные, т.к. результат разных аппроксимирующих функций может отличаться в зависимости от параметров самого измеряемого процесса

Date: 2011-07-01 03:41 pm (UTC)
gemelen: (pic#)
From: [personal profile] gemelen
Небольшие поправки:
1. Ваш набор экспериментальных данных терминологически не числовой ряд, а либо выборка/временной ряд в терминах эконометрики (её могут подать под названием (прикладной) статистики), либо - просто табличные данные в терминах численных методов (вычислительной математики). Ряд это немножко другое и из анализа.
2. Если я правильно понимаю означенную задачу - 'получить аналитическую формулу по таким-то данным', то вопрос в рамках численных методов: интерполирование функции. Существует достаточно много разных способов интерполирования, один из которых упомянут выше - метод наименьших квадратов. Вообще же, при получении аналитической формулы начинают с низших степенй (с линейных функций). Вот Excel построил вам трендовую функцию второго порядка (судя по виду графика), но это из другой оперы.
Итого: нужна конкретика задачи - для чего нужен это график.
ПС: одним числом (коэффициентом, а не степенью) описать функцию скорее всего не получится. Количество же коэффициентов будет зависеть от выбранного приближения искомой функции.