新聞中心
深圳沙盤模型公司:準確建立統計模型的實用指南!
如果你運行的是純預測模型,而變量之間的關系不是重點,那就容易多了。繼續運行逐步回歸模型。讓數據給你最好的預測。
一、記住回歸系數是邊際結果。
這意味著每個預測因子的系數是該預測因子對響應變量的獨特影響。除非所有的預測器都是獨立的,否則這不是完全的效果。這是在控制模型中其他變量后的效果。所以模型中的其他內容很重要。系數可能會發生很大的變化,這取決于模型中的其他因素。
如果兩個或兩個以上的預測因子在解釋一個結果時重疊,那么這兩個重疊都不會反映在回歸系數中。它在整體模型F統計和r平方中,但不是系數。
二、從單變量描述和圖表開始。
它將幫助您查找在清理過程中丟失的任何錯誤。但更重要的是,你必須知道你在做什么。首先要做的是單變量描述,或者更好的是,圖形。你不僅僅是在尋找鐘形曲線。你要在發行版中間尋找有趣的休息。具有大量點的值。令人驚訝的值,通常比您預期的高得多或變化較小。一旦將這些變量放入模型中,它們可能表現得很有趣。如果你知道他們進去時是什么樣子,你就會更好地理解為什么。
三、接下來,運行雙變量描述,再次包括圖。
你還需要了解每一個潛在的預測器是如何獨立地與結果和其他預測器相關的。因為回歸系數是邊際結果,了解變量之間的雙變量關系將使您了解為什么某些變量在更大的模型中失去顯著性。
四、在集合中考慮預測器。
許多模型中,預測因子在理論上是不同的。通過首先在這些集合中構建模型,我們能夠看到相關變量是如何一起工作的,然后在我們把它們放在一起之后發生了什么。
通常情況下一個集合中的變量是相關的,但在集合之間沒有太多的關聯。如果你把所有東西都放在一起,很難找到任何關系。這是一個巨大的,壓倒性的混亂。
通過首先單獨構建每一個集合,您可以構建理論上有意義的模型,并對各個部分是如何組合在一起有一個扎實的理解。
五、模型構建和解釋結果是同步進行的。
你運行的每一個模型都會告訴你一個故事。停下來聽聽。看看系數。看看R平方。它變了嗎?有控制變量的模型到沒有控制變量的模型,系數的變化有多大?當您暫停執行此操作時,可以對下一個運行的模型做出更好的決策。
六、交互中涉及的任何變量都必須單獨存在于模型中。
當你決定留在模型中的什么和從模型中啟動什么時,很容易去掉所有不在模型中的東西。