Yayın: 9 Şubat 2022
Mevcut dairemle olan sözleşme neredeyse sona erdi ve harika akşam yemekleri düzenlemek için yeni bir yer arıyorum. İlk önce, normal bir insan gibi, çevrimiçi yerlere bakıp bir emlakçıyı ziyaret etmek gibi düşündüm. Ama bu çok sıkıcı olurdu, kendime dedim ki, ben bir veri bilimciyim, daha iyi bilmeliyim.
Amacımız, 2022 Mart sonuna kadar taşınmam gerektiği için, Tokyo'da en düşük fiyatlı evi hızlı bir şekilde bulmak! Evsiz kalmasın diye, en basit makine öğrenimi modellerinden biriyle devam ediyoruz: düzenlileştirilmiş doğrusal regresyon (ridge regresyon). Düzenleme kullanıyoruz çünkü bazı değişkenlerin birleşik kodlanması gerekiyor ve katsayıların patlamasını istemiyoruz.
Bir diğer nedenimiz de doğrusal regresyonu tercih etmemizdir; ev fiyatlarının arkasındaki sürücüleri anlamak için nispeten açıklanabilir bir model oluşturmak istiyoruz. (Üzgünüm çok katmanlı algılayıcı, sen ne olursan ol favorimsin)
Her ev için bağımsız değişkenler temelinde aylık kira tahmin etmek için doğrusal regresyon çalıştıracağız. En büyük pozitif hata (en fazla tahmin edilen ev) ile en alt fiyatlı evi en düşük fiyatlı ev olarak belirleyeceğiz. Bu ev kesinlikle seçilecek, belki de bir sonraki evim?
Bir kod parçası yazdım ve Tokyo'daki birkaç emlak web sitesinden 217,389 evi taradım. Orijinal veriler çok karmaşıktı, bu yüzden veri işleme adımlarını size aktarmayacağım. Son olarak, her ev için veriler aşağıdakileri içerir:
Modellerimizde, bağımlı değişken (kira + yönetim) olacak çünkü aylık ödeme budur. Bağımsız değişkenlerimiz yaş, kat, kat sayısı, alan ve lokal olacak (Tokyo alanındaki şehir). Lokaliteyi birleşik kodlama yapacağız.
Gerçek ve tahmin edilen ev fiyatlarına bakıyoruz:
Modelin R2 değeri yaklaşık olarak %84'tür, bu da bu modelin uygulanmasının 5 dakika içinde gerçekleştirilebilmesi göz önüne alındığında kötü değil. Tahminlerin, gerçek fiyatlara göre eğrildiğini görebilirsiniz. Sanırım çok katmanlı algılayıcı gibi doğrusal olmayan modeller bize çok yüksek R2 değerleri verebilir (Hoş geldin çok katmanlı algılayıcı!)
Şimdi, her değişkenin tahminlere nasıl katkıda bulunduğuna bakıyoruz:
Yukarıdaki gibi görebileceğiniz gibi, bina yaşlandıkça, kira yaklaşık olarak yılda ~800 JPY (7 USD) azalıyor.
İlginç bir nokta, bir binanın toplam kat sayısının (~1,200 JPY, 11 USD) evin gerçek katından (1,000 JPY, 9 USD) daha etkili olmasıdır. Bu yüzden yüksek katlı bir ev arıyorsanız, kısa binalarda olan evlere bakmak en iyisidir. (Örneğin, 10 katlı bir binanın 10. katının, 20 katlı bir binanın 10. katından daha ucuz olması gerekir)
Bu modelden en önemli çıktı, Tokyo'da 1m² ev alanının ~2,200 JPY (20 USD) olduğudur. Fena mı!
Yukarıdaki değişkenlerin yanı sıra, evin lokalitesini (şehir) birleşik kodladık ve modele besledik. Birleşik kodlanmış değişkenler için aldığımız katsayıları inceleyerek, Tokyo içindeki her şehrin konut primini anlayabiliriz. Tokyo bölgesinde en pahalı şehri (区) tahmin edebilir misiniz? Aşağıda:
Minato, Tokyo bölgesinde yaşamak için en pahalı şehirdir, çünkü bu şehirde yaşamak için aylık olarak yaklaşık ~40k JPY (350 USD) ödemeniz gerekir. Onu Shibuya, Chiyoda ve Chuo takip eder. Diğer yandan, 23 semt içindeki bazı şehirlerin varoşlara göre daha ucuz olduğu görülmektedir. Mesela, Adachi, merkezi bir konumda olmasına rağmen, Kunitachi'den (yukarıda gösterilmeyen, çünkü 23 semtlerde değil) daha ucuzdur. Erişim önemliyse Adachi'ye taşınmak oldukça mantıklı olur.
Son aşamadayız şimdi, tüm bu projenin başlamasına neden olan içgörüyü bulmak için: En düşük fiyatlı ev. Bunun için, gerçek ve tahmin edilen fiyatlar arasındaki hatalara bakıyoruz. En yüksek göreceli hataya sahip ev şudur:
Bu evin kirası 50k JPY (430 USD) ancak modelimiz onun 178k JPY (1,500 USD) olması gerektiğini söylüyor... Kesinlikle Shinagawa'da 65m2'lik bir 3DK tek ev için oldukça ucuz görünüyor. Model çalışıyor gibi görünüyor ama bu ev kesinlikle benim tarzım değil. Muhtemelen, akşam yemeklerindeki konuklar kendilerini eğlendirmeyeceklerinden, Sumida nehri üzerinden bakan bir kıyı evine gideceğim.
Günlük görevler için veri bilimi kullanmayı seviyorum, bu makalenin konusu gibi: taşınmak için en düşük fiyatlı evi bulma. Basit modelimiz, Tokyo'daki ev fiyatlarını %84 R2 ile oldukça iyi bir şekilde tahmin etti. Ancak, model sonuçları her zaman bir nebze tuzla alınmalı ve sonuçları nasıl yorumlayacağınız size bağlıdır.
Taranan veri çok zengin olduğundan, bir sonraki adım bir graf konvolüsyon ağı oluşturmak ve ev fiyatlarını tahmin etmek için tren istasyonlarını düğüm olarak kullanmaktır. Bu model, evin bağlantısını hesaba katacaktır.
Bir diğer gelecek proje, evin görüntülerini kullanarak düzeni (1K, 1LDK vb.) tahmin etmektir. Böylece, önemli bir miktar işten tasarruf edilebilir.
Macera devam ediyor!
Bu iş İngilizce'den ChatGPT ile çevrilmiştir. Herhangi bir belirsizlik durumunda İletişim sayfasından bana ulaşabilirsiniz.
Yorum bırak
Yorumlar
Diğer işlere bak
2024/06/03
Kango: Kanji Tahmin Oyunu
2024/07/24
Lingo: Türkiye'nin En Popüler Ücretsiz Online Kelime Oyunu
2024/04/29
Druggio
2024/01/28
Tetris
2022/04/29
Hareket Eden Cisim Tespiti
2022/03/15
Hava Durum Tahmini
2021/12/01
Japonya Ilac Veri Bankasi
2021/09/20
Japonca Yazi Siniflandirmasi
2021/09/01
Seyahat Talep Tahmini