Различие между SD и RMSE
Различие между SD и RMSE
вините если я задаю ламерские вопросы. Origin для линейной корреляции считает некое sd - это standard deviation для y? И оно не равно root-mean-square error? Имеет ли смысл для каких-то задач считать standard deviation для x? И уж совсем простой вопрос - правильно ли я понимаю, что mean absolute error можно считать только через дополнительный цикл, не по формулам?
И ещё вопрос в тему - почему в научных статьях раньше писали RMSE, а теперь пишут MAE?
root-mean-square error это, как я понимаю, корень из усреднённого квадрата разницы между Yi и "идеальным" Yi, т.е. положением точки на линии построенной линейной корреляции для текущего Xi. Всё правильно?
И ещё вопрос в тему - почему в научных статьях раньше писали RMSE, а теперь пишут MAE?
root-mean-square error это, как я понимаю, корень из усреднённого квадрата разницы между Yi и "идеальным" Yi, т.е. положением точки на линии построенной линейной корреляции для текущего Xi. Всё правильно?
- Commander L
- Сообщения: 2319
- Зарегистрирован: Вс ноя 11, 2012 4:00 pm
Re: Различие между SD и RMSE
Можете результаты расчета выложить? Так не шибко понятно о чем речь, а Origin'а у меня нет.
Речь же о линейной регрессии, верно? Или Вы просто считаете коэффициент корреляции Пирсона?
Речь же о линейной регрессии, верно? Или Вы просто считаете коэффициент корреляции Пирсона?
Alea jacta est.
"О, утраченный, ветром оплаканный призрак! Вернись!! Вернись!!" Т.Вулф
"Я боюсь стать таким, как взрослые, которым ничто не интересно, кроме цифр." А. де Сент-Экзюпери
"О, утраченный, ветром оплаканный призрак! Вернись!! Вернись!!" Т.Вулф
"Я боюсь стать таким, как взрослые, которым ничто не интересно, кроме цифр." А. де Сент-Экзюпери
Re: Различие между SD и RMSE
один показатель используется для параметрических вычислений, другой - для непараметрических
Не красота спасёт мир, а транквилизаторы.
Re: Различие между SD и RMSE
Ну вот пример. Набор X:Commander L писал(а): ↑Вт ноя 15, 2022 1:42 pmМожете результаты расчета выложить? Так не шибко понятно о чем речь, а Origin'а у меня нет.
Речь же о линейной регрессии, верно? Или Вы просто считаете коэффициент корреляции Пирсона?
1211,00509
1165,88807
1206,25244
1210,99671
1193,66046
Набор Y:
4,756
0,5
4,31
4,664
2,84
Строю корреляцию, получаю R=0.997709174712545. Эту цифру выдаёт и Origin, и моя программа Chemcraft, коэффициенты A и B тоже совпадают. Ещё Origin выдаёт SD 0,14075, а моя программа RMSE 0.109027003441138 и MAE 0.0891256510106251. Хотелось бы понять, что такое SD (standard deviation) и как его считать.
Я ещё обнаружил, что если поменять x и y, коэффициенты получатся немного другими (в смысле, что например коэффициенты B будут не строго обратны друг другу). Так и должно быть?
Re: Различие между SD и RMSE
картинка
обратный график У вас нет необходимых прав для просмотра вложений в этом сообщении.
Не красота спасёт мир, а транквилизаторы.
Re: Различие между SD и RMSE
Мне по-прежнему непонятно, что такое SD и как оно считается.
Re: Различие между SD и RMSE
А мануал что говорит, как они его определяют?
Re: Различие между SD и RMSE
квадратный корень из дисперсии
Не красота спасёт мир, а транквилизаторы.
Re: Различие между SD и RMSE
Не красота спасёт мир, а транквилизаторы.
Re: Различие между SD и RMSE
Я это не понимаю. Если взять выборку: x=1,2,3,4,5; y=1,2,3,4,5. Origin выдаёт SD=0. В то же время если считать дисперсию как математическое ожидание отклонений от математического ожидания, оно должно быть ненулевым. Т.е. среднее y в данном случае 3, отклонения y от 3 в среднем около 1. Может на страничке неправильно написано?Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.
Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.
Формула дисперсии в теории вероятностей имеет вид:
Формула дисперсии в теории вероятностей
То есть дисперсия — это математическое ожидание отклонений от математического ожидания.
-
- Сообщения: 1157
- Зарегистрирован: Ср фев 26, 2014 11:22 am
Re: Различие между SD и RMSE
Для регрессии же считаются отклонения не от среднего, а от функциональной зависимости: для линейной регрессии - от прямой.Vit Nhoc писал(а): ↑Чт ноя 17, 2022 9:47 amЯ это не понимаю. Если взять выборку: x=1,2,3,4,5; y=1,2,3,4,5. Origin выдаёт SD=0. В то же время если считать дисперсию как математическое ожидание отклонений от математического ожидания, оно должно быть ненулевым. Т.е. среднее y в данном случае 3, отклонения y от 3 в среднем около 1. Может на страничке неправильно написано?
Re: Различие между SD и RMSE
Тогда я не понимаю, чем отличается дисперсия от среднеквадратичного отклонения (root mean square error).Sartorius84 писал(а): ↑Чт ноя 17, 2022 11:07 amДля регрессии же считаются отклонения не от среднего, а от функциональной зависимости: для линейной регрессии - от прямой.Vit Nhoc писал(а): ↑Чт ноя 17, 2022 9:47 amЯ это не понимаю. Если взять выборку: x=1,2,3,4,5; y=1,2,3,4,5. Origin выдаёт SD=0. В то же время если считать дисперсию как математическое ожидание отклонений от математического ожидания, оно должно быть ненулевым. Т.е. среднее y в данном случае 3, отклонения y от 3 в среднем около 1. Может на страничке неправильно написано?
-
- Сообщения: 1157
- Зарегистрирован: Ср фев 26, 2014 11:22 am
Re: Различие между SD и RMSE
https://www.originlab.com/doc/Origin-He ... E_.28SD.29
На n-2 они делят Получается 0,14075 тогда, да
На n-2 они делят Получается 0,14075 тогда, да
Re: Различие между SD и RMSE
Спасибо, теперь вроде сошлось. У меня такой вопрос: какую всё-таки величину ошибки корректно писать в статье, если речь именно о корреляциях?Sartorius84 писал(а): ↑Чт ноя 17, 2022 1:27 pmhttps://www.originlab.com/doc/Origin-He ... E_.28SD.29
На n-2 они делят Получается 0,14075 тогда, да
Квантовая химия обычно плохо напрямую считает величины, но можно строить корреляции между рассчитанными и экспериментальными параметрами (в моём случае - pK), и далее расширять эти корреляции на новые вещества. Для корреляции можно приводить SD, или RMSE, или MAE. Насколько корректно вообще давать второе или третье, раз у нас именно корреляция и не спроста число точек для пересчёта SD сокращается? Т.е. ясно что если корреляции использовать для предсказаний, то величины RMSE или MAE, которые получились по известным точками, немного меньше реальной ошибки, т.к. параметры корреляции A и B тоже сосчитались с небольшой ошибкой.
-
- Сообщения: 1157
- Зарегистрирован: Ср фев 26, 2014 11:22 am
Re: Различие между SD и RMSE
Нагляднее всего доверительный интервал наверно, как у bigM на картинках. А из скаляров MAE IMHO проще воспринимать. Но под требования журнала с большой вероятностью придется подстраиваться.Vit Nhoc писал(а): ↑Чт ноя 17, 2022 2:41 pmСпасибо, теперь вроде сошлось. У меня такой вопрос: какую всё-таки величину ошибки корректно писать в статье, если речь именно о корреляциях?
Квантовая химия обычно плохо напрямую считает величины, но можно строить корреляции между рассчитанными и экспериментальными параметрами (в моём случае - pK), и далее расширять эти корреляции на новые вещества. Для корреляции можно приводить SD, или RMSE, или MAE. Насколько корректно вообще давать второе или третье, раз у нас именно корреляция и не спроста число точек для пересчёта SD сокращается? Т.е. ясно что если корреляции использовать для предсказаний, то величины RMSE или MAE, которые получились по известным точками, немного меньше реальной ошибки, т.к. параметры корреляции A и B тоже сосчитались с небольшой ошибкой.
Re: Различие между SD и RMSE
дисперсия может быть в распределении переменной, но не в коэффициенте корреляции. для него значимы доверительный интервал и р-уровень
Не красота спасёт мир, а транквилизаторы.
Re: Различие между SD и RMSE
тут строится график квантиль -квантиль (отношение разностей предыдущей переменной к последующей)
Не красота спасёт мир, а транквилизаторы.
Re: Различие между SD и RMSE
Я взялся сделать подсчёт доверительного интервала для линейного фита, и сходу не нашёл формул:Sartorius84 писал(а): ↑Чт ноя 17, 2022 3:04 pmНагляднее всего доверительный интервал наверно, как у bigM на картинках. А из скаляров MAE IMHO проще воспринимать. Но под требования журнала с большой вероятностью придется подстраиваться.
https://en.wikipedia.org/wiki/Confidence_interval
Есть набор ошибок - отличие Yi от (AXi+B). Подскажите, как посчитать confidence interval для 95% и 99%?
- Commander L
- Сообщения: 2319
- Зарегистрирован: Вс ноя 11, 2012 4:00 pm
Re: Различие между SD и RMSE
Для случая нормального распределения через коэффициент Стьюдента в каждой точке графика.
Для других случаев - копать в сторону неравенств Берри-Эссеена, например.
Здесь, например, п. 2.4.3.
Для других случаев - копать в сторону неравенств Берри-Эссеена, например.
Здесь, например, п. 2.4.3.
Alea jacta est.
"О, утраченный, ветром оплаканный призрак! Вернись!! Вернись!!" Т.Вулф
"Я боюсь стать таким, как взрослые, которым ничто не интересно, кроме цифр." А. де Сент-Экзюпери
"О, утраченный, ветром оплаканный призрак! Вернись!! Вернись!!" Т.Вулф
"Я боюсь стать таким, как взрослые, которым ничто не интересно, кроме цифр." А. де Сент-Экзюпери
Кто сейчас на конференции
Сейчас этот форум просматривают: Google [Bot] и 59 гостей