- +1
要一眼識(shí)別出城市里品質(zhì)更高的居住空間,數(shù)據(jù)能夠做什么?
在評(píng)估一座城市的內(nèi)部空間時(shí),新一醬一直有一個(gè)困惑:要怎樣才能知道哪些小區(qū)可能會(huì)住著更追求生活品質(zhì)的人?
簡(jiǎn)單的小區(qū)房?jī)r(jià)數(shù)據(jù)并不能幫上這個(gè)忙。從微觀空間來(lái)講,房?jī)r(jià)的決定因素中,房子的位置幾乎是起到了決定性的影響力,而房子外部的因素——比如學(xué)區(qū)——帶來(lái)的偶然影響也往往高于房子內(nèi)部的居住品質(zhì)本身。
看下面的上海小區(qū)房?jī)r(jià)等高線圖就可以很輕易地發(fā)現(xiàn),小區(qū)相對(duì)市中心距離的因素直接影響到了城市內(nèi)的房?jī)r(jià)數(shù)據(jù)產(chǎn)生了明確的圈層效果。

在上面的等高線圖中,新一醬也嘗試做了一份物業(yè)費(fèi)的等高線圖,但幾個(gè)遠(yuǎn)郊別墅區(qū)出現(xiàn)的明顯高值聚集區(qū)又讓我們產(chǎn)生了猶豫——物業(yè)費(fèi)的確對(duì)最高端的一批小區(qū)有比較明確的識(shí)別力,但對(duì)市中心更復(fù)雜的居住環(huán)境來(lái)說(shuō),它很難在狹小的區(qū)間段內(nèi)作為單一指標(biāo)來(lái)識(shí)別出那些諸如“適合城市的中產(chǎn)階層家庭”居住的,具備一定品質(zhì)的小區(qū)。
經(jīng)歷了兩個(gè)重要數(shù)據(jù)直接關(guān)聯(lián)識(shí)別失敗后,新一醬認(rèn)真地靜了一靜。我們總是期待能有一些與現(xiàn)實(shí)經(jīng)歷具備嚴(yán)格相關(guān)性的“超級(jí)指標(biāo)”能夠直接映射出某個(gè)結(jié)論。但實(shí)際上,城市的運(yùn)轉(zhuǎn)總是無(wú)數(shù)事物交織在一起互相作用的。
就好像走在街道上路過(guò)一個(gè)小區(qū)的時(shí)候,你的大腦經(jīng)過(guò)對(duì)它的樓高、外立面新舊、綠化效果或者隔著圍欄看到的遛狗的大爺,通常都能夠處理出來(lái)一個(gè)結(jié)果:這個(gè)小區(qū)的房?jī)r(jià)是該比周邊房子更貴還是更便宜,或者簡(jiǎn)單點(diǎn),“不考慮買(mǎi)不買(mǎi)得起,我是否會(huì)愿意住在這樣的一個(gè)小區(qū)里”。

因此新一醬認(rèn)為,要想分析出一座城市里哪些居住空間更有品質(zhì),更合適的辦法是模擬類(lèi)似這樣的一套主觀感知與決策的過(guò)程,將更多人腦認(rèn)為能夠納入小區(qū)是否更適合居住的因子都放入一個(gè)大池子里。
運(yùn)氣很好的是,最近幾年鏈家開(kāi)始大規(guī)模要求門(mén)店中介對(duì)轄區(qū)內(nèi)的所有小區(qū)進(jìn)行詳細(xì)的數(shù)據(jù)錄入,不僅記錄小區(qū)的建筑年代、樓棟數(shù)與戶數(shù)、物業(yè)費(fèi)、車(chē)位配置等基本的數(shù)據(jù),還包括對(duì)小區(qū)的景觀與設(shè)施配置、業(yè)主及租客特征、安保與保潔,以及其他優(yōu)缺點(diǎn)特征都作了詳細(xì)的文字記錄。(感恩)
這些數(shù)據(jù)與文本信息,正好是新一醬希望在分析池中用到的。于是以上海為案例,新一醬在鏈家上抓取了約1.7萬(wàn)個(gè)小區(qū)的所有詳情數(shù)據(jù)。對(duì)所有數(shù)據(jù)進(jìn)行清洗及標(biāo)準(zhǔn)化之后,新一醬最終從1.7萬(wàn)個(gè)小區(qū)的總量中篩選出了8169個(gè)數(shù)據(jù)全面的小區(qū)作為分析樣本。
在《這些年,上海是如何一點(diǎn)一點(diǎn)變大的》中,新一醬曾經(jīng)對(duì)上海所有小區(qū)的建成年代展開(kāi)分析,而如果疊加它們的外立面描述——它通常也是我們見(jiàn)到小區(qū)的第一印象,你會(huì)看到類(lèi)似上面詞云圖表展現(xiàn)的結(jié)果:間隔40年,上海的小區(qū)外立面在風(fēng)格、色彩和材質(zhì)上已經(jīng)有了明顯的多次迭代。當(dāng)然,建設(shè)時(shí)間更早的小區(qū)得到最大的評(píng)價(jià)是“老”,這也意味著它們的居住空間品質(zhì)會(huì)在觀感層面被直接減分。

當(dāng)然外部設(shè)施通常只是第一印象,人們最終將最多的時(shí)間花在自己的房子內(nèi)部。
2017年,上海市城鎮(zhèn)居民的人均住房面積是36.7平方米,這低于很多級(jí)別更低的城市。住在更寬敞的房子里,是很多人換房子的主要訴求,而住在更有品質(zhì)的房子里,通常是在滿足“更大的房子”前提之后才會(huì)考慮的問(wèn)題。基于這個(gè)判斷,新一醬認(rèn)為,如果一個(gè)小區(qū)的主力戶型面積更大,則它會(huì)更傾向于提供更高品質(zhì)的居住空間。
要識(shí)別一個(gè)小區(qū)的主力戶型,新一醬首先對(duì)每個(gè)小區(qū)內(nèi)的戶型面積數(shù)據(jù)展開(kāi)第一輪分析,排除過(guò)高的異常值后,取小區(qū)內(nèi)所有戶型面積值的頻數(shù)最高區(qū)間中間值作為小區(qū)的代表戶型面積。如果有并列的頻數(shù)最高區(qū)間,則取它們中間值的平均值。

當(dāng)然戶型相關(guān)的數(shù)據(jù)也不僅僅只是面積。戶型朝向及內(nèi)部規(guī)劃的有效性都會(huì)影響到人們?cè)趦?nèi)部的居住品質(zhì)。人們對(duì)這一點(diǎn)的重視尤其出現(xiàn)在大約2000年之后開(kāi)發(fā)的樓盤(pán)上,對(duì)那些由品牌開(kāi)發(fā)商操盤(pán)的樓盤(pán)來(lái)說(shuō),戶型的略微差異都會(huì)顯著影響銷(xiāo)售價(jià)格,乃至品牌聲譽(yù)。

除了這些指標(biāo),人們?cè)谫?gòu)房之前還會(huì)著重考慮的是與誰(shuí)住在一起。其中一個(gè)不太禮貌但足夠直接的問(wèn)法是“這個(gè)小區(qū)是不是動(dòng)遷安置房/經(jīng)適房/廉租房/公租房小區(qū)”。與業(yè)主及租客畫(huà)像相似的,購(gòu)房者會(huì)通過(guò)對(duì)這個(gè)問(wèn)題的回答來(lái)判斷小區(qū)內(nèi)居住人群品質(zhì)的如何。不可回避地,我們也需要將這個(gè)維度的數(shù)據(jù)納入評(píng)價(jià)體系之中。

1 物業(yè)費(fèi)。
2 小區(qū)二手房?jī)r(jià)水平。為了消除空間區(qū)位對(duì)房?jī)r(jià)帶來(lái)的影響,我們計(jì)算的小區(qū)房?jī)r(jià)在所在板塊內(nèi)的價(jià)格水平,每個(gè)板塊分成5級(jí)計(jì)算。
3 房屋屬性。是否為動(dòng)遷安置房/經(jīng)適房/廉租房/公租房,若是則做降分處理。
4 房齡。計(jì)算時(shí)按每十年為一個(gè)年代計(jì)分,1949年之前建造的房子統(tǒng)一記為一類(lèi)。
5 代表戶型面積。
6 戶型優(yōu)點(diǎn)標(biāo)簽占比。包含了“南北通透”“朝南”和“明衛(wèi)”三個(gè)標(biāo)簽,分別計(jì)算小區(qū)內(nèi)包含這些標(biāo)簽的戶型占所有戶型比例。
7 業(yè)主特征。在中介人員記錄的文字描述中,挑選“改善房”“置換”“預(yù)算充足、年紀(jì)較大的購(gòu)房者”“企業(yè)高管”等非首次置業(yè)、非年輕購(gòu)房群體相關(guān)的關(guān)鍵描述,從業(yè)主人群描述角度來(lái)判斷小區(qū)是否具備高品質(zhì)屬性。
8 租客占比。這部分?jǐn)?shù)據(jù)也是從文本描述中提取,沒(méi)有明確的量化比例數(shù)據(jù)。其中,“租客少”會(huì)被判定為加分項(xiàng),而“租客多”則判定為減分項(xiàng),沒(méi)有相關(guān)描述的不計(jì)入。
9 車(chē)位配比。車(chē)位的充裕自然能在一定程度上反映小區(qū)品質(zhì)更高。不過(guò)這項(xiàng)數(shù)據(jù)的缺失比較嚴(yán)重,新一醬只能為缺失小區(qū)暫賦了同板塊相應(yīng)的均值,并忍痛調(diào)低了它的重要性。
將這9項(xiàng)指標(biāo)擬合起來(lái),新一醬一共嘗試了3種方法。
第一種方法是用“多元回歸算法”,它想驗(yàn)證的其實(shí)是新一醬的朋友在最初提出的假設(shè)“是否物業(yè)費(fèi)越高的小區(qū)品質(zhì)一定越高”。這里我們用物業(yè)費(fèi)之外的8項(xiàng)指標(biāo)來(lái)擬合物業(yè)費(fèi),將所有數(shù)據(jù)的75%劃分為訓(xùn)練集,25%作為測(cè)試集。最終得到了較好的擬合效果及每個(gè)指標(biāo)的權(quán)重,賦權(quán)匯總后得到每個(gè)小區(qū)的總分。
但在核查時(shí),新一醬發(fā)現(xiàn)多元回歸的結(jié)果依然受到數(shù)據(jù)可靠性的影響并不足夠理想。因此新一醬決定再引入主觀的“層次分析法”每個(gè)指標(biāo)項(xiàng)設(shè)定主觀權(quán)重,并計(jì)算另一個(gè)版本的小區(qū)品質(zhì)總分。
針對(duì)對(duì)兩個(gè)版本的小區(qū)品質(zhì)總分,新一醬分別提取了各板塊內(nèi)排名10%的小區(qū),并取兩個(gè)版本的交集。
在這個(gè)過(guò)程中,作為一次嘗試,新一醬也引入了非監(jiān)督學(xué)習(xí)中的“DBSCAN分類(lèi)算法”,對(duì)上述指標(biāo)中的房?jī)r(jià)、物業(yè)費(fèi)、房屋屬性減分項(xiàng)、車(chē)位配置4項(xiàng)數(shù)據(jù)展開(kāi)分析,得到了27組特征顯著的分類(lèi)及一組特征散亂的離群點(diǎn)。由于輸入的有效屬性不足,這次分析的結(jié)論只能作為之前得到結(jié)果的輔助方法來(lái)修正一部分結(jié)果。
最終,新一醬算出了上海的790個(gè)高品質(zhì)小區(qū)。
從板塊層面上看,幾乎所有的高品質(zhì)小區(qū)的房?jī)r(jià)都能高于同板塊的小區(qū)均價(jià)。其中與市中心距離較遠(yuǎn)的板塊溢價(jià)率更高,而浦東的幾個(gè)聯(lián)洋、碧云及塘橋的高品質(zhì)小區(qū)房?jī)r(jià)與板塊均價(jià)幾乎沒(méi)有差別。










更重要的是,這套數(shù)據(jù)結(jié)論也反向?yàn)槌鞘袕恼w上標(biāo)識(shí)出了一些更值得關(guān)注的居住空間,它們與高品質(zhì)的居住空間有很大的距離,也許是城市進(jìn)化過(guò)程中值得更新的潛在目標(biāo)。
文/丁成成 沈從樂(lè) 視覺(jué)/王方宏
本文用到的數(shù)據(jù)均抓取自鏈家,可能存在記錄缺失或不準(zhǔn)確等問(wèn)題
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




