好看的玄幻小说,最好看的小说排行,有声读物

引言

在我們的上一篇文章中，我們探索了如何將ChatGPT集成到myCobot 280機械臂中，實現(xiàn)了一個通過自然語言控制機械臂的系統(tǒng)。我們詳細介紹了項目的動機、使用的關鍵技術如ChatGPT和Google的Speech-to-text服務，以及我們是如何通過pymycobot模塊來控制機械臂的。通過將自然語言處理和機械臂控制相結合，我們的項目旨在降低機器人編程的門檻，使得非專業(yè)人士也能輕松地進行機器人編程和實驗。

接下來，在這篇文章中，我們將討論在開發(fā)這一系統(tǒng)過程中遇到的挑戰(zhàn)，我們是如何克服這些挑戰(zhàn)的，以及項目未來的擴展可能性。我們的目標是深入了解技術實施的具體問題，并探索該系統(tǒng)未來發(fā)展的新方向。

開發(fā)當中遇到的困難

在開發(fā)集成了ChatGPT的mycobot 280機械臂控制系統(tǒng)的過程中，我面臨了幾個主要的技術挑戰(zhàn)。

1.語音識別的準確性和響應時間

首先，我遇到的挑戰(zhàn)是語音識別的準確性和反應時間。盡管使用了Google的Speech-to-text，但在實際應用中，我發(fā)現(xiàn)它有時難以準確識別專業(yè)術語或在嘈雜環(huán)境中捕捉語音指令。可能是因為不太理解底層邏輯運行的一個原理是什么，也不知道如何來正確的使用。此外，從語音輸入到文本輸出的過程延遲較長，如何來判斷這句話是不是說完了，通常響應的時間較久。

在我說完之后，大概會有3s左右的響應時間。

2.OpenAI API的實用性和地域限制

ChatGPT的API 是整個項目的核心功能點，沒有了他就不能實現(xiàn)AI的機械臂控制系統(tǒng)了。在一開始測試代碼的時候我用的是WEB版本的ChatGPT，一開始沒有考慮到使用API是一個比較大的問題。

因為地區(qū)的問題，沒有辦法直接通過API進行訪問OpenAI，會出現(xiàn)網絡延遲，不能夠使用代理等軟件來實現(xiàn)訪問。除此之外還得確保網絡的穩(wěn)定性才能夠快快速的進行處理。

3.自然語言轉指令的處理

如果解決了上邊的生成代碼的問題，我們將會得到類似于命令行的字符串，需要將它轉變成可以編譯的代碼。一開始只考慮到了單行的命令行

"robot.move_to_zero()"

要將字符串轉化成執(zhí)行的代碼可以用到python的getattr()，他是一個內置函數(shù)，用于獲取對象的屬性值。

getattr(object, name[, default]) object：表示要獲取屬性的對象。 name：表示要獲取的屬性的名稱。 default：可選參數(shù)，表示如果指定的屬性不存在時返回的默認值。

getattr() 函數(shù)會嘗試獲取指定對象的指定屬性的值。如果對象具有該屬性，則返回屬性的值；如果對象沒有指定的屬性，但提供了默認值，則返回默認值；如果對象沒有指定的屬性，并且沒有提供默認值，則會引發(fā) AttributeError 異常。

舉個例子直接調用類的方法

class Myclass: def print_1(self)： print("halo word") obj = mycalss() getattr(obj,"print_1")() """ halo word

用這個方法就可以完美解決如何將字符串的形式輸出可執(zhí)行的代碼了！

接下來是將字符串轉化為可執(zhí)行代碼的過程：

我們收到的字符串是代碼的形式例如

"robot.move_to_zero()"

我們要將這一部分進行拆分，分為obj和方法兩部分，就要用到python當中的分割的方法。

# 以.為節(jié)點分為前后兩個部分 command_str = "robot.move_to_zero()" parts = command_str.split(".") parts[0] = "robot" part[1] = "move_to_zero()" # 去掉括號保留，方法名 method_name = part[1].split("()")[0] method = getatter(robot,method_name) method() #處理轉化方法 def execute_command(instance,command_str): try: #分割對象名和方法 parts = command_str.split(".") if len(parts) != 2 or parts[0] != 'robot': print("Invalid command format.") return method_name = parts[1].split("()")[0] #移除括號 #使用getattr 安全的獲取方法引用 if hasattr(instance, method_name): method = getattr(instance, method_name) method() else: print(f"the method {method_name} does not exist!") except Exception as e: print(f"An error occurred: {e}")

這樣就完成了，能夠處理單行的字符串，但是在測試的時候使用產生多行的命令的時候，這個代碼就不行了，它會變成一長串，所以這個方法是無效的。

上述三個是我主要遇到的問題，接下來我將一一的進行解答。

解決方案和應對策略

1.優(yōu)化語音識別

根據我上述描寫的識別延遲的問題，我是通過設置時間來優(yōu)化我的程序。

# 設置timeout為3秒，phrase_time_limit為10秒 audio = recognizer.listen(source, timeout=3, phrase_time_limit=10)

默認設置沒有聽到聲音，一直的進行監(jiān)聽，我設置了時間上的限制10s，也能夠保證我在說完話之后較快的一個響應。

接下來完成的功能代碼

import speech_recognition as sr def speech_to_text(): # 初始化識別器 recognizer = sr.Recognizer() with sr.Microphone() as source: print("start speaking...") # 監(jiān)聽源，設置timeout和phrase_time_limit # timeout：在這段時間內沒有檢測到聲音，則停止監(jiān)聽 # phrase_time_limit：監(jiān)聽的最大時長 try: audio = recognizer.listen(source, timeout=3, phrase_time_limit=10) except sr.WaitTimeoutError: print("No speech was detected within the timeout period.") return None try: # 使用Google的語音識別服務 text = recognizer.recognize_google(audio, language='en-US') print("You said: " + text) return text except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") return None except sr.RequestError as e: print(f"Could not request results from Google Speech Recognition service; {e}") return None

這目前已經可以滿足大部分的需求了，實際的使用情況下來來看，整個的功能還是比較完整的，能夠有效的識別出語音內容，特別是讓我說數(shù)字的時候他主動轉化成阿拉伯數(shù)字，在進行交互的過程中省了處理數(shù)字的問題。

1.自然語言轉化優(yōu)化

如何來解決多行的指令問題呢。

當我們收到,多行的指令就不能跟之前單純的分離來進行處理了得考慮其他的方式，以下的情況默認ChatGPT生成的指令是下面這種換行行的字符串，沒有帶注釋的（ChatGPT很喜歡寫注釋）。

"robot.move_to_zero() robot.grab_position() robot.plus_z_coords(20)"

只要把多個當成一個來看就好了！

# 分割成多行 commands = command_str.strip().split('n') #萬一里面存在一些空白符，得先進行處理 for cmd in commands: cmd = cmd.strip() if not cmd: continue # 我們默認obj 是robot，就只需要獲取方法名字就可以了 if cmd.startswith("robot."): cmd = cmd[6:] # 分割方法名，和參數(shù) if '(' in cmd and cmd.endswith(")"): method_name, args_str = cmd.split('(', 1) method_name = method_name.strip() #刪除前后空格 args_str = args_str.rstrip(")") #刪除右側的） # 移除可能的空白字符，并按逗號分隔參數(shù) args = [arg.strip() for arg in args_str.split(',')] if args_str else []

it works！

3.ChatGPT API的問題

關于這個問題，我目前并沒能很好的進行解決，大家如果有好的方法可以，私信我跟我溝通，因為地區(qū)的問題，并不能夠直接的用API獲取響應。

項目的擴展功能和未來展望
視覺功能

在本次記錄當中，缺少了最重要的一個模塊，視覺模塊，單獨有一個機械臂沒有眼睛的話跟瞎子又有什么區(qū)別呢。對于這一部分的開發(fā)，會需要花費較大的經歷，如果以后有完成一定程度上的開發(fā)，我也會及時出來跟大家進行分享。

之前也有看到日本的Shirokuma 開發(fā)個類似的項目，用到了ChatGPT4-vision的功能，做了說出目標進行抓取的一個功能。

https://twitter.com/neka_nat/status/1733517151947108717

這個項目也是相當?shù)挠幸馑迹o了我不少開發(fā)這個項目的想法。

更加智能的“賈維斯”

相信大家的肯定都有看過鋼鐵俠，隨著AI的不斷發(fā)展，我覺得在不久的將來，肯定會出現(xiàn)一款如同電影當中的機械臂，能夠通過交流的方式來幫助你完成一些工作。

近幾年也能說是人工智能的突發(fā)猛進的幾年，AIGC是近期最火熱的內容，只要接收到內容就可以生成對應的文本，圖像，視頻和音頻等等。

總結

很期待未來，AI和機器人相結合能夠融合到怎樣的一個程度，是不是已經能夠幫助人類做一定的事情了！如果你有一些好的想法，或者對我的項目修改的意見歡迎隨時跟我提出！

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

機器人

機器人

+關注

關注
211

文章
28419

瀏覽量
207108
人工智能

人工智能

+關注

關注
1791

文章
47279

瀏覽量
238511
機械臂

機械臂

+關注

關注
12

文章
515

瀏覽量
24588
ChatGPT

ChatGPT

+關注

關注
29

文章
1561

瀏覽量
7674

《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

研讀《具身智能機器人系統(tǒng)》第7-9章，我被書中對大模型與機器人技術融合的深入分析所吸引。第7章詳細闡述了ChatGPT for Roboti

發(fā)表于 12-24 15:03

自然語言處理在聊天機器人中的應用

上歸功于自然語言處理技術的進步。聊天機器人的工作原理聊天機器人的核心是一個對話系統(tǒng)，它能夠處理用戶的輸入（通常是文本形式），并生成相應的回復。這個系統(tǒng)通常包括以下幾個關鍵組件：

發(fā)表于 12-05 15:24 ?437次閱讀

自然語言處理與機器學習的關系自然語言處理的基本概念及步驟

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能和語言學領域的一個分支，它致力于研究如何讓計算機能夠理解、解釋和生成人類語言。機器學習（Ma

發(fā)表于 12-05 15:21 ?483次閱讀

語音識別與自然語言處理的關系

在人工智能的快速發(fā)展中，語音識別和自然語言處理（NLP）成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音，而自然語言處理則讓

發(fā)表于 11-26 09:21 ?382次閱讀

自然語言處理與機器學習的區(qū)別

在人工智能的快速發(fā)展中，自然語言處理（NLP）和機器學習（ML）成為了兩個核心的研究領域。它們都致力于解決復雜的問題，但側重點和應用場景有所不同。 1. 自然語言處理（NLP）定義： 自然語

發(fā)表于 11-11 10:35 ?586次閱讀

機器人技術的發(fā)展趨勢

能力。 機器人能夠通過學習和訓練，不斷優(yōu)化自身的行為和性能，實現(xiàn)更高效、更智能的工作。 自然語言處理與理解：隨著自然語言處理技術的進步，機器人

發(fā)表于 10-25 09:27 ?939次閱讀

自然語言處理技術有哪些

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領域的一個分支，它致力于使計算機能夠理解、解釋和生成人類語言。自然語言處理技術的發(fā)展已經取得

發(fā)表于 07-03 14:30 ?1154次閱讀

自然語言處理模式的優(yōu)點

得到了廣泛的應用，如搜索引擎、語音助手、機器翻譯、情感分析等。 1. 提高信息獲取效率 自然語言處理技術能夠快速地從大量文本數(shù)據中提取關鍵信息，幫助用戶節(jié)省查找和篩選信息的時間。例如，搜索引擎通過NLP

發(fā)表于 07-03 14:24 ?788次閱讀

自然語言處理技術的核心是什么

，廣泛應用于機器翻譯、情感分析、語音識別、智能問答、文本摘要等眾多領域。 自然語言處理技術的發(fā)展可以追溯到20世紀50年代。1950年，圖靈提出了著名的圖靈測試，標志著自然語言處理

發(fā)表于 07-03 14:20 ?755次閱讀

自然語言處理是什么技術的一種應用

廣泛，包括機器翻譯、語音識別、情感分析、信息檢索、問答系統(tǒng)、文本摘要、聊天機器人等。一、自然語言處理的基本概念 自然語言：自然語言是人類用

發(fā)表于 07-03 14:18 ?908次閱讀

大象機器人開源協(xié)作機械臂機械臂接入GPT4o大模型！

本文已經或者同濟子豪兄作者授權對文章進行編輯和轉載引言隨著人工智能和機器人技術的快速發(fā)展，機械臂在工業(yè)、醫(yī)療和服務業(yè)等領域的應用越來越廣泛。通過結合大模型和多模態(tài)AI，

發(fā)表于 07-03 14:09 ?935次閱讀

自然語言處理技術的原理的應用

自然語言處理（Natural Language Processing, NLP）作為人工智能（AI）領域的一個重要分支，旨在使計算機能夠理解和處理人類自然語言。隨著互聯(lián)網的普及和大數(shù)據技術的發(fā)展

發(fā)表于 07-02 12:50 ?531次閱讀

國產Cortex-A55人工智能教學實驗箱_基于Python機械臂跳舞實驗案例分享

發(fā)行包管理，它也提供一些工具和庫用于獲取、建立、編寫和執(zhí)行多機融合的程序。機械臂通過ROS機器人操控系統(tǒng)，簡化了6自由度串行總線舵機復雜運動控制

發(fā)表于 06-28 14:37

自然語言控制機械臂：ChatGPT與機器人技術的融合創(chuàng)新（上）

廣泛。隨著AI技術的進步，機械手臂不僅能執(zhí)行復雜的操作任務，還能通過自然語言處理技術進行更加直觀的交互，極大提高了靈活性和用戶友好性。就比如說微軟的一個人工智能研究中心，研究如何用

發(fā)表于 04-11 14:36 ?714次閱讀

自動化革命：大象機器人的Mercury A1機械臂

引言大象機器人的Mercury系列，是面向工業(yè)自動化和智能制造的新型機械臂產品線。這些機械臂不僅在設計上

發(fā)表于 01-15 14:41 ?727次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

自然語言控制機械臂：ChatGPT與機器人技術的融合創(chuàng)新（下）

評論

《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

自然語言處理在聊天機器人中的應用

自然語言處理與機器學習的關系自然語言處理的基本概念及步驟

語音識別與自然語言處理的關系

自然語言處理與機器學習的區(qū)別

機器人技術的發(fā)展趨勢

自然語言處理技術有哪些

自然語言處理模式的優(yōu)點

自然語言處理技術的核心是什么

自然語言處理是什么技術的一種應用

大象機器人開源協(xié)作機械臂機械臂接入GPT4o大模型！

自然語言處理技術的原理的應用

國產Cortex-A55人工智能教學實驗箱_基于Python機械臂跳舞實驗案例分享

自然語言控制機械臂：ChatGPT與機器人技術的融合創(chuàng)新（上）

自動化革命：大象機器人的Mercury A1機械臂