Ovládanie hlasom pre Arduino, NodeMCU, ESP a ďalšie..

Pojem ovládanie hlasom je dnes jednoznačne spojený s inteligentnou domácnosťou, či riadením procesov, modulov z internetu. Dnes vám prinášam spôsob, ako do vašich projektov priniesť interaktivitu v podobe ovládania hlasom. Existuje mnoho technológii, ktoré umožňujú prevod hlasu na text.
https://www.soundandvision.com/images/styles/600_wide/public/122116_parks_voice.jpg?itok=kBUHI8V3
V našom výukovom článku sa zameriame na technológiu Webkit Speech Recognition. Jedná sa o systém, ktorý umožňuje jednoducho a efektívne prevádzať reč na text. Jedným z parametrov technológie je výber jazyka. Plná podpora slovenčiny, češtiny je samozrejmosťou. Webaplikácia, postavená mnou, v ktorej technológia beží je postavená tak, že používateľ má dve varianty vstupu:
Požiadavka zadaná textom do input poľa stránky.
Požiadavka zadaná hlasom po kliknutí na obrázok mikrofónu na stránke.
Výsledok oboch variant je identický. Výsledok sa zapíše do .txt súboru, s ktorým vie následne každý mikroprocesor pracovať. Strana mikroprocesora je postavená jednoducho, čo zaručí porozumenie kódu každého programátora. Mikroprocesor si prečíta reťazec v .txt súbore a uloží ho do príslušnej premennej. Premenná sa dá následne porovnať s reťazcami v kóde, čo umožní následný výber akcie.
http://www.iconsdb.com/icons/preview/black/equal-sign-2-xxl.png
Je vhodné použiť viacero porovnateľných reťazcov pre jednu akciu, nakoľko preklad je dosť citlivý na vyslovenie jednotlivých hlások. Niekedy Webkit preloží led ako let, alebo zapíše veľkými písmenami LED. Občas sa stane, že medzi led a číslom ledky nie je medzera a reťazec ostane v tvare Zapni led2. Ak porovnávame identickosť reťazca s reťazcami v kóde, tak sa môže stať, že získame výstup: Zapni LED 1, ale v kóde budeme porovnávať reťazec s Zapni led 1. Požiadavka sa nevykoná, nakoľko reťazce nie sú identické, i keď sa v nich vyskytujú tie isté znaky. V prípade, že si veríte viac v PHP časti, môžete tieto reťazce prevádzať už na strane servera a transformovať ich napríklad na reťazec Zapni LED 1, ktorý následne porovnáte v kóde NodeMCU. Pri Webkite je dôležitý a zároveň kľúčový výber jazyka. Pre výber slovenského jazyka nastavte v súbore index.php recognition.lang = “sk-SK”; v prípade českého jazyka nastavte recognition.lang = “cs-CZ”;, v prípade angličtiny recognition.lang = “en-US”;.
http://legacy.imissionaries.org/wp-content/uploads/2014/03/utf-8-picture-logo.jpg
Dobrou vecou je i vyhnúť sa diakritike, nakoľko na strane servera i klienta môže dôjsť k zmiešanému/rozdielnemu kódovaniu. Po uložení slova Čau si ho môže mikroprocesor stiahnuť ako ÄŚau, čo tiež veľmi nepomôže porovnaniu reťazcov, no na strane servera je možné to riešiť transformáciou do správneho tvaru. Toto riešenie je dobré napríklad pre spínanie svetiel, kedy si mikroprocesor raz prečíta požiadavku, vykoná a aj keď si ju stiahne opakovane, tak sa nič nedeje, nakoľko je na výstupe taká istá hodnota.

**Čo ale použiť v prípade ovládania intenzity svetla, ak ju chceme navýšiť o 20% jeden krát? **

Ak si mikroprocesor stiahne takýto reťazec opakovane, bude neustále navyšovať intenzitu do maximálneho možného štádia, ktoré je už limitované výstupom, alebo dôjde k zničeniu daného osvetlenia, diódy. Dobrou praxou je uložiť si predchádzajúci reťazec a porovnať s aktuálnym stiahnutým.
Tento postup umožní nevykonať akciu, pokým prijatý reťazec nebude iný ako terajší, prípadne je ho možné doplniť o podmienku s dodaním 1-krát, 2-krát… Poprípade je možné requestom na PHP stránku obsah súboru vymazať, aby sa už nestiahol reťazec duplicitne.
Projekt je veľmi jednoduché použiť i do projektov inteligentnej domácnosti, ovládania domu, monitoringu veličín.
http://paolaelefante.com/wp-content/uploads/2015/02/AndroidUseYourVoiceToText.jpg
Prostredníctvom hlasu môžeme ovládať aj vstupy, kedy po hlasovej požiadavke mikroprocesor získa zo vstupu údaj o teplote a vie ho zaslať/vypísať tam, kde používateľ potrebuje. V tomto systéme je veľmi jednoduché nakódovať automatický/manuálny režim.

Čo budem potrebovať na spustenie ovládania hlasom?

Webserver (lokálny/verejný) s HTTPS protokolom
PHP súbory
.txt súbor
Mikroprocesor (Arduino, NodeMCU, ESP32, Raspberry, Orange Pi… a iné)
Pripojenie k internetu
Prehliadač Chrome

Testovanie prebiehalo s notebookom a smartfónom s prehliadačom Chrome. Prvý krát je potrebné mikrofón potvrdiť. Pri opakovanej návšteve stránky už mikrofón funguje bezproblémovo a nie je nutné ho potvrdiť. Mikrofón ale funguje výlučne na HTTPS (šifrovanej) stránke, nakoľko na nešifrovanej stránke ho blokuje samotný prehliadač.
https://img1.banggood.com/thumb/view/oaupload/banggood/images/6B/97/3cda1ef7-adef-92d8-f26b-9c047864b814.jpg
Na strane mikroprocesora som použil dosku NodeMCU v3 Lolin, kde som nenarazil na žiaden problém z pohľadu spracovania a vyhodnotenia stiahnutého obsahu súboru. Riešenie som testoval až pre 8 výstupov. V prípade použitia pripojenia na HTTPS stránku je nutné do kódu vložiť aj odtlačok HTTPS certifikátu stránky - (fingerprint) v kóde. Riešenie je kompatibilné aj s NodeMCU v2. Stiahnutý reťazec je v kóde pod premennou line. V kóde sa nachádza aj ukážka ovládania 4 led diód za pomoci stiahnutého reťazca, ktorý je možné pozmeniť hlasom. Fingerprint získate po návšteve vašej HTTPS stránky kliknutím pravým tlačidlom myši --> Preskúmať --> Security --> View certificate --> záložka Podrobnosti --> Odtlačok verejného kľúča(SHA1).
http://www.workorderts.com/VB_Uploads/import_ssl_certificate/firefox_cert_warning2.png
httpspripojenie.ino – súbor pre NodeMCU

[code]#include <ESP8266WiFi.h>
#include <WiFiClientSecure.h>
const int led1 = 16;
const int led2 = 5;
const int led3 = 4;
const int led4 = 0;
const char* ssid = “wifimeno”;
const char* password = “heslo”;
const char* host = “vasastranka.sk”; //bez https a www
const int httpsPort = 443;
const char* fingerprint = “13 9f 87 1d b1 85 be e6 bd 73 c1 8d 04 63 58 99 f0 32 43 92”;

void setup() {
Serial.begin(115200);
Serial.println();
pinMode(led1, OUTPUT);
pinMode(led2, OUTPUT);
pinMode(led3, OUTPUT);
pinMode(led4, OUTPUT);
Serial.print(“pripajam na “);
Serial.println(ssid);
WiFi.begin(ssid, password);
while (WiFi.status() != WL_CONNECTED) {
delay(500);
Serial.print(”.”);
}
Serial.println("");
Serial.println(“WiFi pripojene”);
Serial.println("IP adresa: ");
Serial.println(WiFi.localIP());

}

void loop() {

WiFiClientSecure client;
Serial.print("pripajam sa na ");
Serial.println(host);
if (!client.connect(host, httpsPort)) {
Serial.println(“pripojenie neuspesne”);
return;
}

if (client.verify(fingerprint, host)) {
Serial.println(“certifikat zhodny”);
} else {
Serial.println(“certifikat nezhodny”);
}

String url = “/ preklady.txt”;
Serial.print("poziadavka na adresu: ");
Serial.println(url);

client.print(String("GET “) + url + " HTTP/1.1\r\n” +
"Host: " + host + “\r\n” +
“User-Agent: NodeMCU\r\n” +
“Connection: close\r\n\r\n”);

Serial.println(“poziadavka vykonana”);
while (client.connected()) {
String line = client.readStringUntil(’\n’);

if (line == "\r") {
  Serial.println("hlavicka obdrzana");
  break;
}

}
String line = client.readStringUntil(’\n’);

Serial.println(“Odpoved bola:”);
Serial.println("==========");
Serial.println(line);

if(line==“Zapni LED 1” || line ==“Zapni led 1” || line ==“Zapni let 1” || line ==“Zapni LED jeden” || line ==“Zapni LED1” || line ==“Zapni led1”){
digitalWrite(led1, HIGH);
}
if(line==“Vypni LED 1” || line ==“Vypni led 1” || line ==“Vypni let 1” || line ==“Vypni LED jeden” || line ==“Vypni LED1” || line ==“Vypni led1”){
digitalWrite(led1, LOW);
}
if(line==“Zapni LED 2” || line ==“Zapni led 2” || line ==“Zapni let 2” || line ==“Zapni LED dva” || line ==“Zapni LED2” || line ==“Zapni led2”){
digitalWrite(led2, HIGH);
}
if(line==“Vypni LED 2” || line ==“Vypni led 2” || line ==“Vypni let 2” || line ==“Vypni LED dva” || line ==“Vypni LED2” || line ==“Vypni led2”){
digitalWrite(led2, LOW);
}
if(line==“Zapni LED 3” || line ==“Zapni led 3” || line ==“Zapni let 3” || line ==“Zapni LED tri” || line ==“Zapni LED3” || line ==“Zapni led3”){
digitalWrite(led3, HIGH);
}
if(line==“Vypni LED 3” || line ==“Vypni led 3” || line ==“Vypni let 3” || line ==“Vypni LED tri” || line ==“Vypni LED3” || line ==“Vypni led3”){
digitalWrite(led3, LOW);
}
if(line==“Zapni LED 4” || line ==“Zapni led 4” || line ==“Zapni let 4” || line ==“Zapni LED styri” || line ==“Zapni LED4” || line ==“Zapni led4”){
digitalWrite(led4, HIGH);
}
if(line==“Vypni LED 4” || line ==“Vypni led 4” || line ==“Vypni let 4” || line ==“Vypni LED styri” || line ==“Vypni LED4” || line==“Vypni led4”){
digitalWrite(led4, LOW);
}
if(line==“Vypni”){

  digitalWrite(led1, LOW);
   digitalWrite(led2, LOW);
    digitalWrite(led3, LOW);
    digitalWrite(led4, LOW);
}
 if(line=="Zapni"){
 
  digitalWrite(led1, HIGH);
   digitalWrite(led2, HIGH);
    digitalWrite(led3, HIGH);
    digitalWrite(led4, HIGH);
}

Serial.println("==========");
Serial.println(“uzatvaram pripojenie”);
}[/code]
PHP časť – web-serverová časť pozostáva z dvoch php súborov, css súboru a jedného obrázku.
https://i.nahraj.to/f/1OgA.jpg
**index.php **- -> zadávanie klávesnicou/hlasom - -> hlas sa aktivuje kliknutím na mikrofón na stránke, php kód v súbore spracuje požiadavku zadanú klávesnicou
ajax.php --> spracuje výsledok reči na text a vloží ho do .txt súboru rovnako ako php kód na index.php
Decibel.png – obrázok mikrofónu - Non copyright
stylesheet.css – CSS štýly pre index.php súbor – grafika
preklady.txt --> textový súbor, ktorý sa neustále prepisuje php súbormi, sťahuje ho mikroprocesor
Knižnice k .ino súboru pre NodeMCU: ulozto.sk/!RqkW7KJhe6XG/esp8266-https-%20http-rar
PHP súbory: ulozto.sk/!h20FDroE7wWx/ovladanie-hlasom-%20svetelektro-rar
Heslo: svetelektro.sk
Video z testu s jednou LED-kou na ukážku funkčnosti:
youtube.com/watch?v=FwcPEALti4Y
Dostupné aj na Githube github.com/martinius96/ovladanie-hlasom-nodemcu-arduino-raspberry-orangepi-php
Odporúčania: Skryte si PHP časť za heslo, stránku neindexujte, je to dobré pre zaistenie integrity ovládania práve vami. Nezabudnite na HTTPS protokol a prehliadač Chrome! Ak si po požiadavke hlasom prezeráte .txt súbor a nie je v ňom zmena, stlačte Ctrl+F5! Riešenie je možné použiť pre dosky Arduino, Raspberry, Orange Pi a akékoľvek iné, ktoré je možné napojiť do internetu akoukoľvek technológiou, Ethernet, Wifi, GSM, GPRS, 3G, LTE. Akonáhle certifikát expiruje, alebo je obnovený s novým --> iným odtlačkom, NodeMCU sa nepripojí na stránku! Sledujte preto dátum expirácie vášho HTTPS certifikátu.

V PHP súboroch sa využívajú užitočné funkcie pre uľahčenie práce s reťazcami:
htmlspecialchars --> prevod špeciálnych znakov na bezpečné, chráni pred XSS – spusteniu javascriptov
trim --> Medzery orezané v reťazci napr „Ahoj ako? “ bude transformované na: „Ahoj ako?“
Podporiť ma môžete a nájsť zaujímavé projekty, ktoré som realizoval na: arduino.php5.sk
http://1.bp.blogspot.com/-8axtoqb2PkY/U5oD_HdrzrI/AAAAAAAAJAE/sYzWtokwq7k/s1600/Bye-smiley.png
P.S. čoskoro plánujem zverejniť aj projekt inteligentnej domácnosti s ovládaním 8 výstupov so zdrojovými kódmi na platforme klienta NodeMCU
Cieľom článku bolo ukázať novú metódu vstupu, ktorú je možné ľahko integrovať aj do existujúcich projektov. Nejedná sa o profi riešenie!
Prajem veľa šťastia vo vašich interaktívnych projektoch!