在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Python pacp模塊:自動識別文字中的省市區并將其繪圖

python爬蟲知識分享 ? 來源:python爬蟲知識分享 ? 作者:python爬蟲知識分享 ? 2022-06-27 17:19 ? 次閱讀

一個用于提取簡體中文字符串中省,市和區并能夠進行映射,檢驗和簡單繪圖的python模塊。

舉個例子:

["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區"]
        ↓ 轉換
|省    |市   |區    |地址                 |
|上海市|上海市|徐匯區|虹漕路461號58號樓5樓  |
|福建省|泉州市|洛江區|萬安塘西工業區        |

注:“地址”列代表去除了省市區之后的具體地址

也可以將大段文本中所有提到的地址提取出來,并且自動將相鄰的存在所屬關系的地址歸并到一條記錄中(0.5.5版本新功能):

"分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區"
        ↓ 轉換
|省    |市   |區    |
|上海市|上海市|徐匯區|
|福建省|泉州市|洛江區|
|江蘇省|南京市|鼓樓區|

代碼目前僅僅支持python3

pip install cpca

注:cpca是chinese province city area的縮寫

如果覺得本模塊對你有用的話,施舍個star,謝謝。

常見安裝問題:

在 windows 上可能會出現類似如下問題

Building wheel for pyahocorasick (setup.py) ... error

先去下載 Microsoft Visual C++ Build Tools, 安裝完成后,再重新使用 pip install cpca 安裝,即可解決問題

開始使用

本模塊中最主要的方法是cpca.transform,該方法可以輸入任意的可迭代類型(如list,pandas的Series類型等),然后將其轉換為一個DataFrame,下面演示一個最為簡單的使用方法:

location_str = ["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "北京朝陽區北苑華貿城"]
import cpca
df = cpca.transform(location_str)
df

輸出的結果為(adcode為官方地址編碼):

   省     市    區          地址              adcode
0 上海市 上海市  徐匯區     虹漕路461號58號樓5樓  310104
1 福建省 泉州市  洛江區     萬安塘西工業區        350504
2 北京市 市轄區  朝陽區     北苑華貿城           110105

如果你想獲知程序是從字符串的那個位置提取出省市區名的,可以添加一個pos_sensitive=True參數

location_str = ["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "北京朝陽區北苑華貿城"]
import cpca
df = cpca.transform(location_str, pos_sensitive=True)
df

輸出如下:

     省    市    區        地址               adcode        省_pos  市_pos 區_pos
0  上海市  上海市  徐匯區  虹漕路461號58號樓5樓   310104     -1     -1      0
1  福建省  泉州市  洛江區  萬安塘西工業區         350504     -1      0      3
2  北京市  市轄區  朝陽區  北苑華貿城            110105     -1     -1      0

從大段文本中提取多個地址(0.5.5版本新功能):

import cpca
df = cpca.transform_text_with_addrs("分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區")
df

結果為(注意 transform_text_with_addrs 獲得的數據,“地址”列都是空的):

    省     市     區    地址   adcode
0  上海市  市轄區  徐匯區       310104
1  福建省  泉州市  洛江區       350504
2  江蘇省  南京市  鼓樓區       320106

transform_text_with_addrs 還支持和 transform 類似的 index, pos_sensitive 以及 umap 參數

繪圖:

模塊中還自帶一些簡單繪圖工具,可以在地圖上將上面輸出的數據以熱力圖的形式畫出來.

這個工具依賴folium,為了減小本模塊的體積,所以并不會預裝這個依賴,在使用之前請使用pip install folium .

代碼如下:

import cpca
from cpca import drawer
df = cpca.transform_text_with_addrs("分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區")
drawer.draw_locations(df[cpca._ADCODE], "df.html")

繪圖展示

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自動識別
    +關注

    關注

    3

    文章

    222

    瀏覽量

    22856
  • python
    +關注

    關注

    56

    文章

    4802

    瀏覽量

    84890
收藏 人收藏

    評論

    相關推薦

    垃圾短信?手機自動識別垃圾短信邏輯的分析

    作者:京東科技 賈玉龍 1 背景 隨著智能手機的普及和移動互聯網的發展,短信作為一種傳統的通訊方式,仍然保持著其獨特的地位。然而,隨著垃圾短信的泛濫,手機自動識別垃圾短信的技術也在不斷進步。對于提供
    的頭像 發表于 12-16 10:19 ?239次閱讀

    Arduino采集雷達模塊數據與串口繪圖

    Arduino采集雷達模塊數據與串口繪圖
    的頭像 發表于 12-14 11:44 ?272次閱讀
    Arduino采集雷達<b class='flag-5'>模塊</b>數據與串口<b class='flag-5'>繪圖</b>

    客流統計自動識別攝像頭

    隨著城市化進程的加快和商業活動的日益繁榮,客流統計成為了商家和城市管理者關注的重要指標。為了更精準地獲取客流數據,客流統計自動識別攝像頭應運而生,成為現代商業和公共管理不可或缺的工具。客流統計
    的頭像 發表于 12-10 15:32 ?180次閱讀
    客流統計<b class='flag-5'>自動識別</b>攝像頭

    中國物品編碼中心一行蒞臨新大陸自動識別參觀調研

    近日,中國物品編碼中心總工程師李建輝,中國物品編碼中心產品運營開發部副主任、中國自動識別技術協會秘書長方方等一行蒞臨新大陸自動識別公司參觀調研。福建省標準化研究院副院長林孟朝、福建省標準化研究院編碼應用研究所所長周順驥陪同調研。新大陸
    的頭像 發表于 11-19 09:32 ?268次閱讀

    基于改進ResNet50網絡的自動駕駛場景天氣識別算法

    摘要:為了充分利用自動駕駛汽車路測圖像數據,增加行駛過程對天氣情況識別的準確性,提出了一種基于改進ResNet50網絡的自動駕駛場景天氣識別
    的頭像 發表于 11-09 11:14 ?962次閱讀
    基于改進ResNet50網絡的<b class='flag-5'>自動</b>駕駛場景天氣<b class='flag-5'>識別</b>算法

    MCU串口自動識別波特率原理分析

    現在的單片機資源越來越豐富了,其中我們常用的串口也是內部集成了多個,關鍵功能也越來越強了。 我們有些應用可能會用到串口自動識別波特率,今天就來講講MCU串口自動識別波特率底層的常見的原理,以及MCU的案例。
    的頭像 發表于 10-23 16:12 ?733次閱讀
    MCU串口<b class='flag-5'>自動識別</b>波特率原理分析

    PCM9211的默認模式下,ADC和RXIN2( 光纖輸入)是自動識別的嗎,并且光纖具有輸入優先級?

    咨詢一下,PCM9211的默認模式下,ADC和RXIN2( 光纖輸入)是自動識別的嗎,并且光纖具有輸入優先級?
    發表于 09-29 06:44

    智能化升級:機載無人機攝像頭如何自動識別目標?

    機載無人機攝像頭在智能化升級的過程自動識別目標的能力得到了顯著提升。這一過程涉及多個關鍵技術和算法,以下是關于機載無人機攝像頭如何自動識別目標的詳細解析: 一、圖像采集與預處理 高清攝像頭
    的頭像 發表于 09-19 15:23 ?751次閱讀
    智能化升級:機載無人機攝像頭如何<b class='flag-5'>自動識別</b>目標?

    光學識別字符是自動識別技術嗎

    光學識別字符(Optical Character Recognition,簡稱OCR)是一種自動識別技術,它能夠將各種類型文檔(如掃描的紙質文檔、PDF文件或數字相機拍攝的圖片)文字
    的頭像 發表于 09-10 15:43 ?511次閱讀

    水位自動識別攝像機

    隨著科技的不斷發展,水位自動識別攝像機作為一種智能技術產品,正在逐漸應用于各種領域,為監測水位提供了更加便捷、準確的方法。這種攝像機可以自動識別水位的高低,實時監測水域情況,為防洪排澇、水資源
    的頭像 發表于 07-31 10:34 ?418次閱讀
    水位<b class='flag-5'>自動識別</b>攝像機

    多光譜明火自動識別攝像機

    當今社會,火災事故頻發,給人們的生命財產帶來了嚴重的危害。為了提高火災預警和應急處置的效率,多光譜明火自動識別攝像機應運而生。這種先進技術結合了多光譜成像和人工智能技術,可以實時監測周圍環境并
    的頭像 發表于 07-27 15:24 ?374次閱讀
    多光譜明火<b class='flag-5'>自動識別</b>攝像機

    RFID軍標單裝自動識別銘牌 - 提升效率首選

    RFID軍標單裝自動識別銘牌標簽是專為軍事領域設計的一款高規格、自動識別、及時反饋的設備,它主要采用RFID射頻識別技術的軍標標簽,具有卓越的安全性能和穩定性。
    的頭像 發表于 06-19 15:10 ?597次閱讀
    RFID軍標單裝<b class='flag-5'>自動識別</b>銘牌 - 提升效率首選

    自動識別水位預警攝像機

    自動識別水位預警攝像機是現代城市水域安全管理的重要組成部分。這種攝像機具有多項功能,使其在水位監測和異常情況識別方面發揮關鍵作用。其高清攝像頭能夠捕捉水位變化的細節,提供精確的監控畫面。這意味著
    的頭像 發表于 06-07 10:47 ?614次閱讀
    <b class='flag-5'>自動識別</b>水位預警攝像機

    通道堵塞自動識別攝像機

    通道堵塞自動識別攝像機是一種利用先進的人工智能和圖像識別技術來監測和識別通道堵塞情況的裝置,廣泛應用于交通管制、商場管理等領域。這項技術的出現極大地提高了通道管理的效率和準確性,為改善人們的出行
    的頭像 發表于 06-05 10:54 ?374次閱讀
    通道堵塞<b class='flag-5'>自動識別</b>攝像機

    護目鏡佩戴自動識別預警攝像機

    護目鏡佩戴自動識別預警攝像機是一種智能監測設備,專門用于佩戴護目鏡的工人進行作業時,能夠自動識別有潛在風險的場景,并及時發出預警信號。該攝像機配備人臉識別和智能預警系統,可以檢測危險情況并為工人提供
    的頭像 發表于 05-24 10:08 ?678次閱讀
    護目鏡佩戴<b class='flag-5'>自動識別</b>預警攝像機
    主站蜘蛛池模板: 热久久最新地址| 狠狠要| www.av天天| 天天摸天天澡天天碰天天弄| 国产农村一一级特黄毛片| 欧美激欧美啪啪片免费看| 五月婷色| 免费国产不卡午夜福在线观看| 丁香六月色婷婷| 就要爱综合| 亲女乱h文小兰第一次| 性xxxxbbbb免费播放视频| 国产人人澡| 欧美亚洲一区二区三区在线| 视频网站黄色| аⅴ天堂中文在线网| 免费观看美女被cao视频| 国产乱子伦| 国产精品福利午夜h视频| 日本xxxx69日本| 亚洲美女视频一区| 亚洲国产人久久久成人精品网站| 男男小说高h| 成年人污视频| 黄网站视频| 激情五月俺来也| 男人的午夜天堂| 香港三澳门三日本三级| 欧美色婷婷天堂网站| 欧美综合视频| 国产欧美色图| 天天天操天天天干| 天天操天天干天天射| 天天射视频| 国产成人永久在线播放| 在线观看视频免费| 操女人在线| 日本边添边爱边摸边做边爱| 性生大片一级毛片免费观看| 四虎精品免费永久在线| 日本国产高清色www视频在线|