Я пытаюсь удалить аномальные точки данных в диаграмме рассеяния Excel. В настоящее время у меня естьэтот. Мне очевидно, что в красной области есть некоторая линейная связь, а в синей области есть несколько аномальных точек. Я знаю, что, очевидно, можно удалить их по отдельности из таблицы, чтобы они не отображались на графике, но это займет очень много времени, чтобы найти каждую из проблемных точек из более чем 240. Есть ли способ удалить их, глядя на сам график, чтобы исключить их из расчета любой линейной регрессии?
Спасибо.
решение1
Если вы считаете, что ваши данные линейны, и хотите удалить точки, расположенные ниже линии, то вы можете произвольно определить, где эта линия должна пересекать ваши данные, и использовать формулу, которая поможет вам определить, находится ли точка выше или ниже линии.
Пример: представим, что ваша линейная формула имеет вид
y=-0.2x - 66
Затем в своих данных создайте вспомогательный столбец и используйте следующую формулу:
Cell C2 formula: =IF((-0.2*A2)-66<=B2,"Above","Below")
Перетащите его вниз, затем отсортируйте данные и удалите «Ниже».