Deepseek-R1 Kuchanganya AI na Kompyuta ya Edge kwa IoT ya Viwanda

Utangulizi

Aina ndogo zilizo na ukubwa mdogo wa DeepSeek-R1 zimetengenezwa vizuri kwa kutumia data ya mnyororo iliyofikiriwa na Deepseek-R1, iliyowekwa alama na...Tepe, kurithi uwezo wa hoja wa R1. Hifadhidata hizi zilizowekwa vizuri ni pamoja na michakato ya hoja kama vile mtengano wa shida na makato ya kati. Kujifunza kwa uimarishaji kumeunganisha muundo wa tabia ya mfano na hatua za hoja zinazozalishwa na R1. Utaratibu huu wa kunereka huruhusu mifano ndogo kudumisha ufanisi wa computational wakati unapata uwezo mgumu wa hoja karibu na zile za mifano mikubwa, ambayo ni ya thamani kubwa ya matumizi katika hali zilizo na rasilimali. Kwa mfano, toleo la 14B linafikia 92% ya kukamilisha msimbo wa mfano wa asili wa DeepSeek-R1. Nakala hii inaleta mfano wa DeepSeek-R1 na matumizi yake ya msingi katika kompyuta ya makali ya viwandani, muhtasari katika mwelekeo nne zifuatazo, pamoja na kesi maalum za utekelezaji:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Utunzaji wa vifaa vya utabiri

Utekelezaji wa kiufundi

Sensor Fusion:

Unganisha vibration, joto, na data ya sasa kutoka PLCs kupitia itifaki ya Modbus (kiwango cha sampuli 1 kHz).

Uchimbaji wa kipengele:

Run Edge msukumo kwenye Jetson Orin NX ili kutoa huduma za mfululizo wa wakati wa 128.

Mfano wa mfano:

Toa mfano wa DeepSeek-R1-Distill-14b, kuingiza veta za kipengele ili kutoa maadili ya uwezekano.

Marekebisho ya Nguvu:

Trigger Matengenezo ya kazi wakati ujasiri> 85%, na kuanzisha mchakato wa ukaguzi wa sekondari wakati <60%.

Kesi inayofaa

Schneider Electric ilipeleka suluhisho hili kwenye mashine za madini, kupunguza viwango chanya vya uwongo na 63% na gharama za matengenezo na 41%.

1

Kuendesha Mfano wa Deepseek R1 kwenye Kompyuta za Inhand AI

Ukaguzi wa kuona ulioboreshwa

Usanifu wa pato

Bomba la kawaida la kupelekwa:

Kamera = Gige_vision_camera (500fps) # Kamera ya Viwanda ya Gigabit
sura = kamera.capture () # picha ya kukamata
Iliyotangulia = OpenCv.Denoise (sura) # Kurekebisha utangulizi
defect_type = deepseek_r1_7b.infer (prerocessed) # Uainishaji wa kasoro
Ikiwa kasoro_type! = 'kawaida':
Plc.trigger_reject () # trigger utaratibu wa kuchagua

Metriki za utendaji

Usindikaji kuchelewesha:

82 ms (Jetson Agx Orin)

Usahihi:

Ugunduzi wa kasoro ya sindano hufikia 98.7%.

2

Matokeo ya Deepseek R1: Washindi na Wapotezaji katika Chain ya Thamani ya AI

Mchakato wa mtiririko wa mtiririko

Teknolojia muhimu

Mwingiliano wa lugha ya asili:

Waendeshaji wanaelezea anomalies ya vifaa kupitia sauti (kwa mfano, "shinikizo la shinikizo la extruder ± 0.3 MPa").

Hoja za Multimodal:

Mfano hutoa maoni ya optimization kulingana na data ya kihistoria ya vifaa (kwa mfano, kurekebisha kasi ya screw na 2.5%).

Uthibitishaji wa mapacha wa dijiti:

Uthibitishaji wa simulizi ya parameta kwenye jukwaa la Edgex Foundry.

Athari ya utekelezaji

Mmea wa kemikali wa BASF ulipitisha mpango huu, kufikia kupunguzwa kwa 17% ya matumizi ya nishati na ongezeko la 9% ya kiwango cha ubora wa bidhaa.

3

Edge AI na Baadaye ya Biashara: OpenAI O1 dhidi ya Deepseek R1 kwa Huduma ya Afya, Magari, na IIoT

Kurudisha papo hapo kwa msingi wa maarifa

Ubunifu wa usanifu

Database ya vector ya ndani:

Tumia chromadb kuhifadhi miongozo ya vifaa na uainishaji wa michakato (Vipimo vya Kuingiza 768).

Kurudisha kwa mseto:

Kuchanganya algorithm ya BM25 + kufanana kwa cosine kwa swala.

Kizazi cha Matokeo:

Mfano wa R1-7B muhtasari na kusafisha matokeo ya kurudisha.

Kesi ya kawaida

Wahandisi wa Nokia walitatua mapungufu ya inverter kupitia maswali ya lugha asilia, kupunguza wakati wa usindikaji wa wastani na 58%.

Changamoto za kupelekwa na suluhisho

Mapungufu ya kumbukumbu:

Ilitumia teknolojia ya kuongeza kache ya KV, kupunguza utumiaji wa kumbukumbu ya mfano wa 14B kutoka 32GB hadi 9GB.

Kuhakikisha utendaji wa wakati halisi:

Imetulia latency moja ya uelekezaji kwa ± 15 ms kupitia utaftaji wa graph ya CUDA.

Model Drift:

Sasisho za kuongezeka kwa kila wiki (kusambaza 2% tu ya vigezo).

Mazingira yaliyokithiri:

Iliyoundwa kwa safu ya joto pana ya -40 ° C hadi 85 ° C na kiwango cha ulinzi cha IP67.

5
微信图片 _20240614024031.jpg1

Hitimisho

Gharama za sasa za kupelekwa sasa zimepungua hadi $ 599/node (Jetson Orin NX), na matumizi mabaya yanaunda katika sekta kama vile utengenezaji wa 3C, mkutano wa magari, na kemia ya nishati. Uboreshaji unaoendelea wa usanifu wa MOE na teknolojia ya kuongezeka inatarajiwa kuwezesha mfano wa 70B kukimbia kwenye vifaa vya makali mwishoni mwa 2025.

Pata suluhisho la kebo ya ELV

Kudhibiti nyaya

Kwa BMS, basi, viwanda, kebo ya ala.

Mfumo ulioandaliwa wa nyaya

Mtandao na data, cable ya fiber-optic, kamba ya kiraka, moduli, uso

Maonyesho ya 2024 na Mapitio ya Matukio

Aprili.16-18, 2024 Middle-East-Energy huko Dubai

Aprili.16th-18, 2024 Secrika huko Moscow

Mei.9, 2024 Bidhaa mpya na Teknolojia Uzinduzi wa Tukio huko Shanghai

Oct.22nd-25th, 2024 Usalama China huko Beijing

Novemba.19-20, 2024 Ulimwengu uliounganishwa KSA


Wakati wa chapisho: Feb-07-2025