统计211

标题: 回归分析中写方程的问题 [打印本页]

作者: adorablekid    时间: 2011-7-5 17:46
标题: 回归分析中写方程的问题
数据拟合的结果是对数函数
pic.JPG (16.19 KB, 下载次数: 13)
参数:常数为-0.788,b1=0.213
这样就是Y=-0.788+0.213lnx,但是图中明显不是这样的,而且按照这个方程,x=1的时候还是负的,这对累计百分比是不可能的。。。本人菜鸟,彻底无解,求大侠指点迷津
作者: abc886y365hxg    时间: 2011-7-5 20:19
图的像素和分辨率那些太小了,看不到是怎么样的情况?
作者: 藤菜    时间: 2011-7-5 21:23
需要你的数据与清晰的结果才行。
作者: adorablekid    时间: 2011-7-6 11:03
[attach]721[/attach]
作者: adorablekid    时间: 2011-7-6 11:04
pic.jpg (13.99 KB, 下载次数: 3)
作者: abc886y365hxg    时间: 2011-7-6 20:40
说明这个拟合方程不符合实际啊!需要另外的数学模型进行拟合!
研究中要注意以下两点:
           1.具有数学意义[不等于]具有实际意义!
           2.具有统计学意义[不等于]具有临床意义!
作者: adorablekid    时间: 2011-7-7 10:34
abc886y365hxg 发表于 2011-7-6 20:40
说明这个拟合方程不符合实际啊!需要另外的数学模型进行拟合!
研究中要注意以下两点:
           1.具有 ...

可是从图上看,拟合得很好啊,比如说x=1000时,方程计算出来的Y值是小于0的,可是图中明显是正数啊,求指教{:1_178:}
作者: veil    时间: 2011-7-7 10:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: adorablekid    时间: 2011-7-7 10:48
su2005 发表于 2011-7-6 17:13
历史最长的帖子,但我没看懂题意。

第一次发帖子,弄得不好,见笑见笑。
我是有4953个频次,按照降序排列,计算总和,然后分别计算这些频次所对应的累积百分比,所以第4753项所对应的累积百分比为1.
我用SPSS拟合,发现三次,二次以及对数曲线拟合效果比较好,考虑到二次,三次曲线只是一部分符合,总体的曲线走势不符合实际情况,而且对数曲线的拟合效果也是最好的,我就选择了对数,拟合出来的方程是
Y=-0.788+0.213lnx,从方程看,x=1000时Y也是负数,并不符合图中的对数曲线啊,感觉曲线方程跟曲线本身并不符合,感觉很奇怪,很无奈{:1_173:}
作者: abc886y365hxg    时间: 2011-7-7 11:41
adorablekid 发表于 2011-7-7 10:34
可是从图上看,拟合得很好啊,比如说x=1000时,方程计算出来的Y值是小于0的,可是图中明显是正数啊,求指 ...

       你好像没懂我给你讲的那个数学模型没实际意义的问题,没办法,我只能给你展示一个效果更好的数学模型,且能够有实际意义的情况了! 未命名.JPG (44.38 KB, 下载次数: 1) ,你原来的那个方程决定系数也只有0.971,现在的这个方程决定系数为0.9993!!且基本能够符合实际了!!
建议给我加点分哈,亲手给你做了!
作者: abc886y365hxg    时间: 2011-7-7 11:45
veil 发表于 2011-7-7 10:45
1,根据你给出的y的范围逆推X的范围是发现,x最小值是e的3.720143333333333333333333333333次方,接近10,这 ...

哈哈{:1_177:},vei给我加点分哈!!我帮那求助的小子做了曲线拟合!他好像不懂我给他讲的数学模型没选对这句话!!
作者: adorablekid    时间: 2011-7-7 14:30
abc886y365hxg 发表于 2011-7-7 11:41
你好像没懂我给你讲的那个数学模型没实际意义的问题,没办法,我只能给你展示一个效果更好的数学模 ...

高手啊,谢啦,弱弱地问下,这个多项式在SPSS里哪里操作啊,还有,我可以给你加分吗,是不是没资格?PS,我不是小子{:1_178:}
作者: abc886y365hxg    时间: 2011-7-7 17:46
adorablekid 发表于 2011-7-7 14:30
高手啊,谢啦,弱弱地问下,这个多项式在SPSS里哪里操作啊,还有,我可以给你加分吗,是不是没资格?PS,我 ...

1. 很多软件都可以做的,matlab、excel、lingo,当然spss也可以的!不好意思啊,说了一句小子!欢迎光临软件应用板块哈!!
2.如果在spss里面做的话,就需要先把每一个X^4、X^3、X^2、x等先计算出来,输入每一列,也可以在spss里面计算产生,然后再进行线性回归,就可得到结果了!希望对你有帮助!!
3.欢迎光顾软件应用板块,我会尽我所能帮助需要帮助的人的!!
作者: pigtail    时间: 2011-7-10 10:44
abc886y365hxg 发表于 2011-7-7 11:41
你好像没懂我给你讲的那个数学模型没实际意义的问题,没办法,我只能给你展示一个效果更好的数学模 ...

对于你所说的模型,盲目崇拜指标值,我只能无语
作者: abc886y365hxg    时间: 2011-7-10 10:55
pigtail 发表于 2011-7-10 10:44
对于你所说的模型,盲目崇拜指标值,我只能无语

那你来解释一下吧!你整一个更好的模型咯
作者: pigtail    时间: 2011-7-11 09:05
abc886y365hxg 发表于 2011-7-10 10:55
那你来解释一下吧!你整一个更好的模型咯

按你看类R^2值,7阶的方程至少不会不你的差吧
作者: abc886y365hxg    时间: 2011-7-11 09:44
pigtail 发表于 2011-7-11 09:05
按你看类R^2值,7阶的方程至少不会不你的差吧

声明一下哈:
    1.前面我只给出的是一个比较好的模型,看我前面的陈述,不代表是最好的哈,但是相比于楼主的模型来说,已经满足了回归效果好,且所有点的累计概率预测值都大于了0,且是一个递增函数,最高点也差不多是1。
    2.对于你说的7阶方程的问题,我想说一句:一般而言,大部分的曲线动能用多项式对其进行拟合并预测,但是多项式拟合存在一个问题,就是随着阶数的不断增加,方程出来的图像可以看出,上下波动的情况会不断增加,虽然不断升高阶数,能够实现所有的点都在直线上,R^2=1,但是,此时的方程已经不能作为预测用了,不能对数据趋势进行真确的预测;有些情况下,如果阶数太低,方程本身的趋势性太强(如一阶就只能是是直线,二阶就只能是一个弯弯的线或弧),拟合的效果也不见得很好。所以对于多项式拟合,需要根据自己数据的实际情况,选择合适的阶数,以达到合理合适的目的!!
    3.如果六阶都能达到三个九的【决定系数】,再增加为七阶,增加了方程的复杂程度是否可取和有必要呢?
    4.对于1-5阶我都试了的,就是因为在最后几个点处,方程值不接近一,反而会向下降【原因见2】,所以不满足累计概率递增的情况,不予采用。
作者: abc886y365hxg    时间: 2011-7-11 09:49
pigtail 发表于 2011-7-11 09:05
按你看类R^2值,7阶的方程至少不会不你的差吧

声明一下哈:
    1.前面我只给出的是一个比较好的模型,看我前面的陈述,不代表是最好的哈,但是相比于楼主的模型来说,已经满足了回归效果好,且所有点的累计概率预测值都大于了0,且是一个递增函数,最高点也差不多是1。
    2.对于你说的7阶方程的问题,我想说一句:一般而言,大部分的曲线动能用多项式对其进行拟合并预测,但是多项式拟合存在一个问题,就是随着阶数的不断增加,方程出来的图像可以看出,上下波动的情况会不断增加,虽然不断升高阶数,能够实现所有的点都在直线上,R^2=1,但是,此时的方程已经不能作为预测用了,不能对数据趋势进行真确的预测;有些情况下,如果阶数太低,方程本身的趋势性太强(如一阶就只能是是直线,二阶就只能是一个弯弯的线或弧),拟合的效果也不见得很好。所以对于多项式拟合,需要根据自己数据的实际情况,选择合适的阶数,以达到合理合适的目的!!
    3.如果六阶都能达到三个九的【决定系数】,再增加为七阶,增加了方程的复杂程度是否可取和有必要呢?
    4.对于1-5阶我都试了的,就是因为在最后几个点处,方程值不接近一,反而会向下降【原因见2】,所以不满足累计概率递增的情况,不予采用。
    综上,我认为,选6阶方程来作为本问题的模型,是一比较可行的模型!!
作者: pigtail    时间: 2011-7-11 17:06
abc886y365hxg 发表于 2011-7-11 09:49
声明一下哈:
    1.前面我只给出的是一个比较好的模型,看我前面的陈述,不代表是最好的哈,但是相比于 ...

呵呵,六阶的系数为-2E-21,几乎是0了吧(如果算上软件对0的处理,可以直接当成0看待),无法看出六阶咋是个比较合理的。对于任何曲线,可以用多项式无限逼近(具体参考Weierstrass 第一逼近定理),而对于具有随机性的东西,应该在精度和偏差中找个衡量(即过度拟合问题),为满足你所说的累积概率不减,取值0-1问题,多项式是不适合的,应考虑logistic,logit等族类曲线拟合的。
作者: abc886y365hxg    时间: 2011-7-11 17:42
pigtail 发表于 2011-7-11 17:06
呵呵,六阶的系数为-2E-21,几乎是0了吧(如果算上软件对0的处理,可以直接当成0看待),无法看出六阶咋是 ...

哎,算了,咱们看来还有分歧,不讨论了,累得很,让楼主自己选择吧!
来我的板块耍耍啊!
作者: wangming    时间: 2011-7-12 17:55
很是精彩。
作者: 天蓝    时间: 2011-7-13 12:53
一个“回归”引发的“血案”,果然给力。
作者: Davidhust    时间: 2011-11-30 14:15
这个还要注意联系实际,lim y -> 1
作者: shjrxytjyb    时间: 2012-1-2 21:12
su2005 发表于 2011-7-6 17:13
历史最长的帖子,但我没看懂题意。

同!
作者: wei    时间: 2012-1-16 17:06
看了大家的帖子以后,学到了一些有用的东西;
对于网友提出的
                        具有数学意义[不等于]具有实际意义!
                        具有统计学意义[不等于]具有临床意义!
表示同感;
确实统计分析的结果,一定要参照实际的分析目的\意义(如农业类相关试验及结果统计分析)进行酌情考虑分析!

作者: 江米条    时间: 2013-7-6 08:23
需要增加数据对的取值范围,构造模型所需样本的取值范围一般应该等于大于实际推测值得范围,既样本应该尽量取到两端的极值.此处很明显有两个既定的极值(限定范围):最小值X=0时Y=0,最大值X=最大文献量时,Y=1.在构建模型时因该将这两对数据加入才能保证模型具有基本的理论意义.
实际意义就不知道了.
作者: 风雨    时间: 2013-7-7 11:04
这个数据模型的拟合可能有问题啊!
作者: Coran    时间: 2013-7-26 13:17
搞那么多阶,不好解释吧
作者: Coran    时间: 2013-7-26 13:17
搞那么多阶,不好解释吧
作者: 隐性买名    时间: 2013-9-25 08:34
学习学习
作者: 隐性买名    时间: 2013-9-25 08:34
学习学习
作者: 隐性买名    时间: 2013-9-25 08:34
学习学习
作者: 隐性买名    时间: 2013-9-25 08:34
学习学习




欢迎光临 统计211 (http://www.tj211.com/) Powered by Discuz! X3.2