Ev Fiyatlari Tahmini

Yayın: 9 Şubat 2022

Ev Fiyatlari Tahmini

Mevcut dairemle olan sözleşme neredeyse sona erdi ve harika akşam yemekleri düzenlemek için yeni bir yer arıyorum. İlk önce, normal bir insan gibi, çevrimiçi yerlere bakıp bir emlakçıyı ziyaret etmek gibi düşündüm. Ama bu çok sıkıcı olurdu, kendime dedim ki, ben bir veri bilimciyim, daha iyi bilmeliyim.

Amaç

Amacımız, 2022 Mart sonuna kadar taşınmam gerektiği için, Tokyo'da en düşük fiyatlı evi hızlı bir şekilde bulmak! Evsiz kalmasın diye, en basit makine öğrenimi modellerinden biriyle devam ediyoruz: düzenlileştirilmiş doğrusal regresyon (ridge regresyon). Düzenleme kullanıyoruz çünkü bazı değişkenlerin birleşik kodlanması gerekiyor ve katsayıların patlamasını istemiyoruz.

Bir diğer nedenimiz de doğrusal regresyonu tercih etmemizdir; ev fiyatlarının arkasındaki sürücüleri anlamak için nispeten açıklanabilir bir model oluşturmak istiyoruz. (Üzgünüm çok katmanlı algılayıcı, sen ne olursan ol favorimsin)

Yöntem

Her ev için bağımsız değişkenler temelinde aylık kira tahmin etmek için doğrusal regresyon çalıştıracağız. En büyük pozitif hata (en fazla tahmin edilen ev) ile en alt fiyatlı evi en düşük fiyatlı ev olarak belirleyeceğiz. Bu ev kesinlikle seçilecek, belki de bir sonraki evim?

Veri temini

Bir kod parçası yazdım ve Tokyo'daki birkaç emlak web sitesinden 217,389 evi taradım. Orijinal veriler çok karmaşıktı, bu yüzden veri işleme adımlarını size aktarmayacağım. Son olarak, her ev için veriler aşağıdakileri içerir:

Veri genel bakışı
  • id: Ön işlemde atanmış her evin benzersiz tanımlayıcısı
  • label: Ev tipini gösterir: tek ev, daire, vs.
  • local: Ev lokalitesini gösterir: Şehirler (23 semt) ve Tokyo'nun varoşları
  • stats_1/2/3_station/distance : Ev ve istasyona yürüme mesafesi arasında en yakın (veya 2., 3. en yakın) istasyonu gösterir (dakika)
  • age: Bina yaşı
  • no_of_floors: Ev bulunduğu binanın toplam kat sayısı
  • new_arrival: Ev web sitesinde yeni listelenmişse
  • floor: Ev katı
  • rent: Aylık kira
  • admin: Aylık yönetim ücreti (管理費)
  • deposit: Ne olduğunu biliyorsunuz
  • gratuity: Ev sahibine teşekkür etmek için bir kez ödemeniz gereken bir ücret (anlamsız değil mi?) (礼金)
  • layout: Ev düzeni. Bunu 2 yatak odası, 3 yatak odası vb. olarak düşünebilirsiniz.
  • area: Ev alanı (metrekare)

Modelleme

Modellerimizde, bağımlı değişken (kira + yönetim) olacak çünkü aylık ödeme budur. Bağımsız değişkenlerimiz yaş, kat, kat sayısı, alan ve lokal olacak (Tokyo alanındaki şehir). Lokaliteyi birleşik kodlama yapacağız.

Tokyo Kulesi

Sonuçlar - 1: Genel

Gerçek ve tahmin edilen ev fiyatlarına bakıyoruz: Tokyo'daki gerçek ve tahmin edilen ev fiyatları

Modelin R2 değeri yaklaşık olarak %84'tür, bu da bu modelin uygulanmasının 5 dakika içinde gerçekleştirilebilmesi göz önüne alındığında kötü değil. Tahminlerin, gerçek fiyatlara göre eğrildiğini görebilirsiniz. Sanırım çok katmanlı algılayıcı gibi doğrusal olmayan modeller bize çok yüksek R2 değerleri verebilir (Hoş geldin çok katmanlı algılayıcı!)

Sonuçlar - 2: Ev fiyatlarının sürücüleri

Şimdi, her değişkenin tahminlere nasıl katkıda bulunduğuna bakıyoruz:

Değişkenler ve ilişkili katsayılar

Yukarıdaki gibi görebileceğiniz gibi, bina yaşlandıkça, kira yaklaşık olarak yılda ~800 JPY (7 USD) azalıyor.

İlginç bir nokta, bir binanın toplam kat sayısının (~1,200 JPY, 11 USD) evin gerçek katından (1,000 JPY, 9 USD) daha etkili olmasıdır. Bu yüzden yüksek katlı bir ev arıyorsanız, kısa binalarda olan evlere bakmak en iyisidir. (Örneğin, 10 katlı bir binanın 10. katının, 20 katlı bir binanın 10. katından daha ucuz olması gerekir)

Bu modelden en önemli çıktı, Tokyo'da 1m² ev alanının ~2,200 JPY (20 USD) olduğudur. Fena mı!

Yukarıdaki değişkenlerin yanı sıra, evin lokalitesini (şehir) birleşik kodladık ve modele besledik. Birleşik kodlanmış değişkenler için aldığımız katsayıları inceleyerek, Tokyo içindeki her şehrin konut primini anlayabiliriz. Tokyo bölgesinde en pahalı şehri (区) tahmin edebilir misiniz? Aşağıda:

Tokyo'nun şehirleri için konut primi

Minato, Tokyo bölgesinde yaşamak için en pahalı şehirdir, çünkü bu şehirde yaşamak için aylık olarak yaklaşık ~40k JPY (350 USD) ödemeniz gerekir. Onu Shibuya, Chiyoda ve Chuo takip eder. Diğer yandan, 23 semt içindeki bazı şehirlerin varoşlara göre daha ucuz olduğu görülmektedir. Mesela, Adachi, merkezi bir konumda olmasına rağmen, Kunitachi'den (yukarıda gösterilmeyen, çünkü 23 semtlerde değil) daha ucuzdur. Erişim önemliyse Adachi'ye taşınmak oldukça mantıklı olur.

Sonuçlar - 3: En düşük fiyatlı ev

Son aşamadayız şimdi, tüm bu projenin başlamasına neden olan içgörüyü bulmak için: En düşük fiyatlı ev. Bunun için, gerçek ve tahmin edilen fiyatlar arasındaki hatalara bakıyoruz. En yüksek göreceli hataya sahip ev şudur:

Tokyo'daki en düşük fiyatlı ev

Bu evin kirası 50k JPY (430 USD) ancak modelimiz onun 178k JPY (1,500 USD) olması gerektiğini söylüyor... Kesinlikle Shinagawa'da 65m2'lik bir 3DK tek ev için oldukça ucuz görünüyor. Model çalışıyor gibi görünüyor ama bu ev kesinlikle benim tarzım değil. Muhtemelen, akşam yemeklerindeki konuklar kendilerini eğlendirmeyeceklerinden, Sumida nehri üzerinden bakan bir kıyı evine gideceğim.

Tokyo'daki nehir kenarı

Sonuç

Günlük görevler için veri bilimi kullanmayı seviyorum, bu makalenin konusu gibi: taşınmak için en düşük fiyatlı evi bulma. Basit modelimiz, Tokyo'daki ev fiyatlarını %84 R2 ile oldukça iyi bir şekilde tahmin etti. Ancak, model sonuçları her zaman bir nebze tuzla alınmalı ve sonuçları nasıl yorumlayacağınız size bağlıdır.

Taranan veri çok zengin olduğundan, bir sonraki adım bir graf konvolüsyon ağı oluşturmak ve ev fiyatlarını tahmin etmek için tren istasyonlarını düğüm olarak kullanmaktır. Bu model, evin bağlantısını hesaba katacaktır.

Bir diğer gelecek proje, evin görüntülerini kullanarak düzeni (1K, 1LDK vb.) tahmin etmektir. Böylece, önemli bir miktar işten tasarruf edilebilir.

Macera devam ediyor!

Sumida Nehri

Bu iş İngilizce'den ChatGPT ile çevrilmiştir. Herhangi bir belirsizlik durumunda İletişim sayfasından bana ulaşabilirsiniz.

Yorum bırak

Yorumlar

Diğer işlere bak