欢乐颂小说在线阅读,有声读物,好看的电视剧

一個用于提取簡體中文字符串中省，市和區并能夠進行映射，檢驗和簡單繪圖的python模塊。

舉個例子：

["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區"]
        ↓ 轉換
|省    |市   |區    |地址                 |
|上海市|上海市|徐匯區|虹漕路461號58號樓5樓  |
|福建省|泉州市|洛江區|萬安塘西工業區        |

注：“地址”列代表去除了省市區之后的具體地址

也可以將大段文本中所有提到的地址提取出來，并且自動將相鄰的存在所屬關系的地址歸并到一條記錄中（0.5.5版本新功能）：

"分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區"
        ↓ 轉換
|省    |市   |區    |
|上海市|上海市|徐匯區|
|福建省|泉州市|洛江區|
|江蘇省|南京市|鼓樓區|

代碼目前僅僅支持python3

pip install cpca

注:cpca是chinese province city area的縮寫

如果覺得本模塊對你有用的話，施舍個star，謝謝。

常見安裝問題：

在 windows 上可能會出現類似如下問題

Building wheel for pyahocorasick (setup.py) ... error

先去下載 Microsoft Visual C++ Build Tools，安裝完成后，再重新使用 pip install cpca 安裝，即可解決問題

開始使用

本模塊中最主要的方法是cpca.transform，該方法可以輸入任意的可迭代類型（如list，pandas的Series類型等），然后將其轉換為一個DataFrame，下面演示一個最為簡單的使用方法：

location_str = ["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "北京朝陽區北苑華貿城"]
import cpca
df = cpca.transform(location_str)
df

輸出的結果為(adcode為官方地址編碼)：

   省     市    區          地址              adcode
0 上海市 上海市  徐匯區     虹漕路461號58號樓5樓  310104
1 福建省 泉州市  洛江區     萬安塘西工業區        350504
2 北京市 市轄區  朝陽區     北苑華貿城           110105

如果你想獲知程序是從字符串的那個位置提取出省市區名的，可以添加一個pos_sensitive=True參數：

location_str = ["徐匯區虹漕路461號58號樓5樓", "泉州市洛江區萬安塘西工業區", "北京朝陽區北苑華貿城"]
import cpca
df = cpca.transform(location_str, pos_sensitive=True)
df

輸出如下：

     省    市    區        地址               adcode        省_pos  市_pos 區_pos
0  上海市  上海市  徐匯區  虹漕路461號58號樓5樓   310104     -1     -1      0
1  福建省  泉州市  洛江區  萬安塘西工業區         350504     -1      0      3
2  北京市  市轄區  朝陽區  北苑華貿城            110105     -1     -1      0

從大段文本中提取多個地址（0.5.5版本新功能）：

import cpca
df = cpca.transform_text_with_addrs("分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區")
df

結果為（注意 transform_text_with_addrs 獲得的數據，“地址”列都是空的）：

    省     市     區    地址   adcode
0  上海市  市轄區  徐匯區       310104
1  福建省  泉州市  洛江區       350504
2  江蘇省  南京市  鼓樓區       320106

transform_text_with_addrs 還支持和 transform 類似的 index, pos_sensitive 以及 umap 參數

繪圖：

模塊中還自帶一些簡單繪圖工具，可以在地圖上將上面輸出的數據以熱力圖的形式畫出來.

這個工具依賴folium，為了減小本模塊的體積，所以并不會預裝這個依賴，在使用之前請使用pip install folium .

代碼如下：

import cpca
from cpca import drawer
df = cpca.transform_text_with_addrs("分店位于徐匯區虹漕路461號58號樓5樓和泉州市洛江區萬安塘西工業區以及南京鼓樓區")
drawer.draw_locations(df[cpca._ADCODE], "df.html")

繪圖展示

審核編輯黃昊宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

自動識別

自動識別

+關注

關注
3

文章
222

瀏覽量
22856
python

python

+關注

關注
56

文章
4802

瀏覽量
84890

垃圾短信？手機自動識別垃圾短信邏輯的分析

作者：京東科技賈玉龍 1 背景隨著智能手機的普及和移動互聯網的發展，短信作為一種傳統的通訊方式，仍然保持著其獨特的地位。然而，隨著垃圾短信的泛濫，手機自動識別垃圾短信的技術也在不斷進步。對于提供

發表于 12-16 10:19 ?239次閱讀

客流統計自動識別攝像頭

隨著城市化進程的加快和商業活動的日益繁榮，客流統計成為了商家和城市管理者關注的重要指標。為了更精準地獲取客流數據，客流統計自動識別攝像頭應運而生，成為現代商業和公共管理中不可或缺的工具。客流統計

發表于 12-10 15:32 ?180次閱讀

中國物品編碼中心一行蒞臨新大陸自動識別參觀調研

近日，中國物品編碼中心總工程師李建輝，中國物品編碼中心產品運營開發部副主任、中國自動識別技術協會秘書長方方等一行蒞臨新大陸自動識別公司參觀調研。福建省標準化研究院副院長林孟朝、福建省標準化研究院編碼應用研究所所長周順驥陪同調研。新大陸自

發表于 11-19 09:32 ?268次閱讀

基于改進ResNet50網絡的自動駕駛場景天氣識別算法

摘要：為了充分利用自動駕駛汽車路測圖像數據，增加行駛過程中對天氣情況識別的準確性，提出了一種基于改進ResNet50網絡的自動駕駛場景天氣識別

發表于 11-09 11:14 ?962次閱讀

MCU串口自動識別波特率原理分析

現在的單片機資源越來越豐富了，其中我們常用的串口也是內部集成了多個，關鍵功能也越來越強了。我們有些應用可能會用到串口自動識別波特率，今天就來講講MCU串口自動識別波特率底層的常見的原理，以及MCU的案例。

發表于 10-23 16:12 ?733次閱讀

PCM9211的默認模式下，ADC和RXIN2( 光纖輸入）是自動識別的嗎，并且光纖具有輸入優先級？

咨詢一下，PCM9211的默認模式下，ADC和RXIN2( 光纖輸入）是自動識別的嗎，并且光纖具有輸入優先級？

發表于 09-29 06:44

智能化升級：機載無人機攝像頭如何自動識別目標？

機載無人機攝像頭在智能化升級的過程中，自動識別目標的能力得到了顯著提升。這一過程涉及多個關鍵技術和算法，以下是關于機載無人機攝像頭如何自動識別目標的詳細解析：一、圖像采集與預處理高清攝像頭

發表于 09-19 15:23 ?751次閱讀

光學識別字符是自動識別技術嗎

光學識別字符（Optical Character Recognition，簡稱OCR）是一種自動識別技術，它能夠將各種類型文檔（如掃描的紙質文檔、PDF文件或數字相機拍攝的圖片）中的文字

發表于 09-10 15:43 ?511次閱讀

水位自動識別攝像機

隨著科技的不斷發展，水位自動識別攝像機作為一種智能技術產品，正在逐漸應用于各種領域，為監測水位提供了更加便捷、準確的方法。這種攝像機可以自動識別水位的高低，實時監測水域情況，為防洪排澇、水資源

發表于 07-31 10:34 ?418次閱讀

多光譜明火自動識別攝像機

當今社會，火災事故頻發，給人們的生命財產帶來了嚴重的危害。為了提高火災預警和應急處置的效率，多光譜明火自動識別攝像機應運而生。這種先進技術結合了多光譜成像和人工智能技術，可以實時監測周圍環境并

發表于 07-27 15:24 ?374次閱讀

RFID軍標單裝自動識別銘牌 - 提升效率首選

RFID軍標單裝自動識別銘牌標簽是專為軍事領域設計的一款高規格、自動識別、及時反饋的設備，它主要采用RFID射頻識別技術的軍標標簽，具有卓越的安全性能和穩定性。

發表于 06-19 15:10 ?597次閱讀

自動識別水位預警攝像機

自動識別水位預警攝像機是現代城市水域安全管理的重要組成部分。這種攝像機具有多項功能，使其在水位監測和異常情況識別方面發揮關鍵作用。其高清攝像頭能夠捕捉水位變化的細節，提供精確的監控畫面。這意味著

發表于 06-07 10:47 ?614次閱讀

通道堵塞自動識別攝像機

通道堵塞自動識別攝像機是一種利用先進的人工智能和圖像識別技術來監測和識別通道堵塞情況的裝置，廣泛應用于交通管制、商場管理等領域。這項技術的出現極大地提高了通道管理的效率和準確性，為改善人們的出行

發表于 06-05 10:54 ?374次閱讀

護目鏡佩戴自動識別預警攝像機

護目鏡佩戴自動識別預警攝像機是一種智能監測設備，專門用于佩戴護目鏡的工人進行作業時，能夠自動識別有潛在風險的場景，并及時發出預警信號。該攝像機配備人臉識別和智能預警系統，可以檢測危險情況并為工人提供

發表于 05-24 10:08 ?678次閱讀