Difference between revisions of "Talk:RoboTower"

From AIRWiki
Jump to: navigation, search
(Lanciapalle)
(TODO)
Line 8: Line 8:
 
# Rules to destroy the tower (Brian need to know when the robot is near the tower and\or the factory) [done! maybe need some more testing...]
 
# Rules to destroy the tower (Brian need to know when the robot is near the tower and\or the factory) [done! maybe need some more testing...]
 
# High-level logic (credits, matches, ...) + GUI [working on that...]
 
# High-level logic (credits, matches, ...) + GUI [working on that...]
 +
#Error-condition check
 
# (Evitare ostacoli "invisibili")
 
# (Evitare ostacoli "invisibili")
  

Revision as of 00:32, 5 August 2012

All the code for the project is hosted on github. The repository can be browsed here.

TODO

  1. RFID markers (testing + pc-side node) [done! needs some testing, as the reader seems not so powerful...]
  2. Mount the STM32F4 board on the robot, make all the connections with the devices installed onboard (sonars, rfid reader, receiver for the signals sent from towers and factories, ...) [done!]
  3. Build towers (with switches + radio control) [done!]
  4. Rules to destroy the tower (Brian need to know when the robot is near the tower and\or the factory) [done! maybe need some more testing...]
  5. High-level logic (credits, matches, ...) + GUI [working on that...]
  6. Error-condition check
  7. (Evitare ostacoli "invisibili")

Project status

Implemented or partially implemented features

  • Game design. A document with the game storyboard and rules is available here.
  • Porting to ROS of the Robowii modules (previously based on DCDT) which control the robot and perform color blob detection
  • Design of the overall architecture (ROS nodes and topics/services). The following figure represents the ROS nodes designed and/or implemented until now (boxes in bold), together with the messages that are exchanged (the names on the arrows) and the interfaces with external libraries and\or the hardware (boxes with dashed line).
Architecture of the implemented system
  • Porting of Mr.Brian Tools (Checker and Gmbte) in Ros Packages
  • Integration of Mr. Brian into the project, and development of the first rules (Spykee searches for the tower and goes towards it, trying to avoid the obstacles - if there are any)
    • Random search (to find the tower)
    • Avoiding obsacles: rules to move left or right if the sonar detects something in front of the robot, and to move backwards in case the obstacle is detected as very near
    • A STM32 F4 Discovery board has been programmed (using the ChibiOS RT Operating System) to manage the connections with the devices added to the robot. It manages the four sonars, the RFID reader, the leds and the receiver of the radio signals. Still needs testing, but it works.

STM32F4 Discovery: notes

To manage the devices added to the robot, we used a STM32F4 Discovery Board. We built the firmware with the chibiOS/RT Operating System.

The board is equipped with an ST-Link v2 programmer, that seems to be officially supported on Windows only. It works on Linux with two methods: using the stlink utility (https://github.com/texane/stlink) or using OpenOCD (you need to build it from git, as stlink support is experimental).

OpenOCD configuration

As stlink support provided by openOCD is still experimental, it has to be explicitly enabled while compiling the sources. After downloading the latest sources from the git repository (the URL should be http://sourceforge.net/scm/?type=git&group_id=274635), compile and install issuing:

    $ ./configure --enable-maintainer-mode --enable-stlink
    $ make
    # make install    (this is needed only to install the binaries system-wide, and must be performed by root)

Starting OpenOCD

When openOCD is correctly configure, it can be started with the command

    $ openocd -f board/stm32f4discovery.cfg

(assuming that the board is connected to the computer).

NB: sometimes the board is not recognized (it happens to me frequently when chibiOS is flashed on the board), and neither openocd nor texane's stlink can connect to the board. In this case, keeping the "reset" button on the board pressed while launching openocd should solve this issue. If this doesn't solve, use the ST Visual Programmer utility (windows only, sorry) to erase the FLASH memory.

Connecting to the board

You now can flash the firmware, run and debug the code from within gdb (an arm version of gdb!). To connect to the openocd gdb server (assuming that firmware.elf is the binary file to be flashed and\or debugged):

   $ arm-none-eabi-gdb filename.elf
   (gdb) target extended-remote localhost:3333

Now that gdb is connected, typing the following commands will erase the FLASH memory, load the new firmware, and - finally - run the firmware!

   (gdb) monitor reset halt
   (gdb) monitor flash probe 0
   (gdb) monitor stm32f2x mass_erase 0
   (gdb) load
   (gdb) monitor reset halt
   (gdb) continue


Ideas for the development

Ostacoli "attivi"

Tag da riconoscere tramite visione (tutte le soluzioni provate hanno dato scarsi risultati in termini di velocità e\o qualità del riconoscimento)

  • 'DataMatrix': riconosciuti bene se fermi nell'immagine, ma troppo lentamente e non riconosciuti in movimento. L'algoritmo è lento (anche 3 secondi se non si impone un timeout)
  • 'Scacchiera (openCV cvFindChessboardCorners)': viene riconosciuta molto male
  • 'ARToolKitPlus': i frame vengono riconosciuti molto velocemente. Problema: l'algoritmo che utilizza dipende enormemente dalle condizioni di luce. In movimento i risultati sono deludenti, anche a velocità moderate. La documentazione è scarsa.

RFID: 'Radio Frequency IDentification

Abbiamo effettuato alcune prove con il lettore ID-12 della ID Innovations (tag a 125 KHz), e possiamo confermare dei risultati abbastanza buoni.

il riconoscimento avviene a una distanza apparentemente sufficiente (anche se di poco) agli scopi del gioco, e a una velocità abbastanza sostenuta da rendere l'esperienza sufficientemente dinamica.

Problematiche: Posizionamento del lettore. Il fatto che l'ID-12 sia dotato di antenna interna rende piuttosto difficoltoso il posizionamento verso il fondo del robot.

E' stata scelta questa soluzione. Il lettore ID-12 trasmette tramite un collegamento seriale a 9600 bps gli id dei tag ricevuti (per dettagli del formato vedi datasheet ID12). La board presente sul robot ritrasmette l'ID tramite connessione wireless (zigbee) al PC.

Ostacoli invisibili

gli ostacoli invisibili sono ostacoli che il sonar non riesce a rivelare perchè, ad esempio troppo bassi (gambe delle sedie) o troppo alti (caloriferi)

idee:

  • Aumento hardware robot (più sonar)
  • Logica

la prima opzione è abbastanza da scartare... complicata e probabili problemi di interferenza. inoltre il sonar sarebbe sottoutilizzato se piazzato per riconoscere ostacoli bassi, e inutile per quelli alti

La seconda opzione è passare al controllore fuzzy (brian) il tempo in cui l'ingresso del sonar non varia significativamente. questo significa che il robot, con buona probabilità, è bloccato. Con un fuzzy set Triangle_or (TOR) si dovrebbe ottenere un comportamento decente.

TOR fuzzy set


idea su come gestire il "tempo di blocco"

  1. calcolo la deviazione standard degli ultimi 20 dati (ossia ultimo secondo circa, poichè il ciclo di controllo è a 20 Hz)
  2. impongo che la stddev sia minore dell'errore accettabile (scelto, ora, fisso)
  3. se l'errore è minore, allora aumenta il tempo di "blocco"
  4. se è invece maggiore, azzeralo.
  5. dai in pasto a brian il tempo, e fuzzyfica.

problemi:

  • Falsi negativi
  • Falsi positivi
  • Comandi a volte troppo brevi

soluzioni:

  • filtraggio passa-basso della varianza
  • Aumento soglie tempo/varianza

Considerazioni La maggior parte dei falsi positivi è dovuta al fatto che il sonar, oltre una certa distanza, tende a non rilevare con precisione le variazioni di distanza delle pareti e di altri ostacoli, senza contare la dispersione possibile del segnale sonoro. si può evitare gran parte dei falsi positivi, introducendo un controllo sull'attuazione della regola, per distanze nel range di buona affidabilità del sonar (si può introdurre la possibilità di introdure l'affidabilità dell'imput??). Sicuramente così, si introducono potenziali falsi negativi, ma, poichè il controllo non può essere perfetto, si può considerare buona l'approssimazione.

Idea per migliorare ulteriormente: considerare anche il sonar sud (e/o i sonar laterali)

Vittoria

Quando il robot Vince? per ora è implementato una condizione di vittoria che prevede di vedere la torre e avere un ostacolo vicino.

Tuttavia, se il robot rileva un ostacolo vicino che non è la torre, e la torre è presente nel campo visivo, il robot crede di aver vinto (il robot vince vedendo la torre, ad esempio, dietro un muro).

Rilevazione abbattimento torri e fabbriche: con interruttori a pressione che scattano quando la torre cade, e trasmettono via radio il segnale di "torre abbattuta" al computer. Per la trasmissione del segnale: telecomandi e ricevitore Aurel RX-4MHCS (datasheet). la soluzione dovrebbe andare, ma è necessario ancora testing...

Riconoscere la distanza da un oggetto "visto"

Come capire se l'oggetto che sto vedendo si trova davantti a me e non dietro a qualche ostacolo?

  • Correlando ciò che Vedo a ciò che Sento

ossia correlando una distanza data dalla visione a una distanza data dal sonar.

Problema: ciò che vedo è un segnale rumoroso, la larghezza del segnale non è affidabile, e la telecamera scatta.

Ostacoli laterali

Un problema della logica e dell'infrastruttura del robot, sono gli "ostacoli laterali" Sebbene dotato di sonar a est e ovest, per ora non sono "molto" utilizzati dalla logica attuale del gioco, in quanto vengono utilizzati solamente per indurre comportamenti intelligenti di uscita dalle situazioni di blocco frontale (ad esempio a causa di un ostacolo), a supporto della scelta casuale, che è necessaria quando non si hanno altre indicazioni.

Un'idea per sfruttare più pienamente le potenzialità del sonar, e indurre un comportamento più "conscio" del campo di gioco da parte del robot, è quello di cercare di mantenere una distanza di sicurezza da ostacoli laterali, se possibile.

problema possibile: il robot potrebbe non essere in grado di attraversare strettoie

Considerazioni:

  • Il robot è già in grado di attraversare strettoie? se si, si può evitare il problema? bastano i due predicati contrapposti?
  • Queste regole sono utili davvero? o possono influire sul normale comportamento del robot negativamente?
  • Se il robot non fosse in grado d afttraversare strettoie, è possibile indurlo a farlo?
  • Si riesce a supplire la mancanza di una ulteriore coppia di sonar obliqui? il cono d'ombra attuale del robot è accettabile?

Working notes about some of the used tools

Uso di MrBrian

File di configurazione

  • behaviour.txt: lista dei possibili comportamenti, dei loro livelli di priorità, e di dove trovarli nel filesystem.
  • file .rul: definiscono i comportamenti possibili del robot, mettendo in relazione a una condizione logica espressa coi predicati fuzzy in ingresso, i predicati fuzzy in uscita che verranno poi defuzzyficati secondo il loro peso (cando, want e antecedente)
  • ctof.txt: Associa al dato crisp in ingresso (oppure in uscita da un livello di MrBrian) una "forma", ossia un'insieme di funzioni e etichette per trasformare il dato crisp in dato fuzzy.
  • s_ftoc.txt: definisce quali sono i dati in uscita e che insieme di valori possono utilizzare
  • shape_ctof.txt: definisce le possibii "forme" che possono essere utilizzate per fuzzyficare un determinato dato in ingresso, ossia un insieme di funzioni e relative etichette in modo da poter associare un valore di "verità" fuzzy l dato in ingresso.
  • s_shape.txt: definisce gli insiemi di valori che possono usare i dati in uscita (solitamente singleton)
  • Predicate.ini: Definisce i predicati Fuzzy semplici, a partire dai dati in ingressso, processati dal fuzzyficatore, oppure i predicati complessi a partire da altri predicati e dati fuzzyficati
  • PredicateActions.ini: Contiene i predicati che sono definiti dai dati fuzzy presi in uscita da ogni livello.
  • Cando.ini: Questo file definisce quando un determinato comportamento può essere eseguito, ossia rappresenta le condizioni necessarie per cui uncomportamento sia "sensato" da eseguire.
  • want.txt: Questo file definisce quando è oppurtuno attivare un determinato comportamento, ossia rappresenta la parte "propositiva" e "strategica" del controllore fuzzy. L'obbiettivo del want è pesare quale delle scelte possibili è la migliore scelta effettuabile, nel determinato caso.

I livelli

Lo scopo della gestione a livelli è rendere indipendente la condizione di attivazione delle regole da possibili condizioni negative che invece ne evitino l'attivazione, rendendo di fatto indipendente la regola da condizioni che esulano il suo contesto. se non ci fossero i livelli, ogni regola dovrebbe considerare dunque le condzioni per cui la sua attivazione potrebbe causare conflitti con comportamenti più critici.

Ad esempio una regola che impone di avanzare al robot è sicuramente meno critica di una regola che gli impone di evitare un ostacolo, e senza i livelli l'avanzata sarebbe condizionata sempre al controllo di eventuali ostacoli di fronte a se.

I livelli funzionano nel seguente modo:

1) Mr Brian comincerà a calcolare i predicati fuzzy a partire dai dati "crisp" in ingresso, ossia applica una "forma" ai dati ricevuti dall'applicazione, che possono essere dati dei sensori, oppure dati elaborati dal programma.

2) Mr Brian calcola il Cando di ogni regola, se è sotto una determinata soglia, la regola non viene attivata.

4) Mr Brian calcola il peso da dare a ciascuna regola con il want

A questo punto entrano in gioco i livelli

5) Mr Brian inizia a calcolare le uscite imposte dalle regole di livelli 1, pesandole con il Cando e il Want (probabile che scelga il minimo dei due come peso)

6) Se si definisce una shape per il dato Fuzzy con etichetta Proposed<nome dato fuzzy in uscita> questo potrà essere utilizzato per definire predicati in predicateActions, in modo da condizionare il comportamento dei livelli superiori, in parte a quello dei livelli inferiori, ove necessario. Ad esempio se a livello 1 abbiamo TanSpeed = 40, avremo a disposizione un dato crisp ProposedTanSpeed, che potremo, se necessario, rifuzzyficare e usare come pre condizione dei livelli successsivi. Non è necessario che TanSpeed e ProposedtanSpeed abbiano la stessa shape: concettualmente sono una uscita il primo (e quindi conviene utilizzare una shape puntuale) e un ingresso il secondo (e quindi teoricamente conviene utilizzare una shape a aree trapezioidali/triangolari).

7) Se presenti regole a livello n+1 attive, esse possono:

  • Leggere i dati fuzzy definiti in predicate.ini, che avranno il medesimo valore rispetto ai dati fuzzy letti dalle regole di livello n
  • Leggere i dati fuzzy in uscita ai livelli precedenti definiti in PredicateActions.ini . Il valore di questi predicati dipende dall'ultimo livello attivo che gli setta e eventualmente da quelli precedenti se il dato non fosse stato cancellato.
  • Cancellare le uscite impostate precedentemente con (&DEL.<nome predicato in uscita> ANY)
  • Imporre nuove uscite al predicato (che i precedenti siano stati cancellati dunque fa sì che la regola sia l'unica a essere applicata)

8) i Dati vengono dunque presi, defuzzyficati e passati al livello successivo, finchè non si raggiungono le regole attive di livello massimo.

9) Il dato fuzzy così prodotto viene mandato in uscita da brian.

ROS

Qui c'è una nostra mini-guida\cheatsheet con i comandi principali e il codice di nodi di esempio (presi dai tutorial), sia per C++ che per Python

Progettazione del gioco

Linee guida

Le seguenti linee guida per lo sviluppo di un Robogame competitivo "di successo" sono state ricavate a partire da alcuni articoli sul progetto di Hi-CoRG.

Caratteristiche generali

  1. Deve consistere in almeno un robot e almeno un giocatore umano in grado di interagire tra di loro cooperativamente o competitivamente
  2. Basso costo e alta efficienza dell’uso dei componenti
  3. Sicuro da giocare
  4. Semplice & divertente (per chi ci gioca)
  5. Il robot deve essere visto dal giocatore come un agente razionale
  6. Il gioco deve essere provato sul campo
  7. il gioco deve coinvolgere più sensi (del giocatore... e del robot) : vista, udito, tatto (ossia colori, suoni e forme)

Caratteristiche del gioco

  1. Obiettivo: deve essere chiaro e semplice, e deve essere suddiviso in sotto-obiettivi (punti) se è troppo lungo
  2. Difficoltà adatta/adattabile al giocatore
  3. Regole facili da capire e imparare
  4. Azioni facili da compiere
  5. Il sistema “gioco” reagisce prontamente alle azioni del giocatore

Caratteristiche del robot

  1. Reagisce al comportamento umano bene (a meno di semplificazioni)
  2. Riceve input nella maniera più affidabile e credibile possibile (anche a costo di semplificazioni)
  3. Aspetto adatto al gioco
  4. Comportamento che non appare casuale, ma razionale e pensato
  5. Funzionamento in tempo reale

Obiettivi di Robogame

  1. portare il gaming verso la sua naturale evoluzione verso la “fisicità”, strada cominciata da Nintendo con il wii, e ormai accettata dalle maggiori case di videogiochi.
  2. Introdurre nella vita quotidiana il robot come qualcosa di “familiare” e utile
  3. Diffondere l’interesse per la robotica ad un pubblico più ampio

Progetto del gioco

Scelta del genere

Per avere un’idea del gioco, si è partito dal presupposto che Robogame sia l’evoluzione del gaming tradizionale, si è partiti quindi dal considerare i generi più usati nei videogiochi attuali:

  • Strategici
  • Gestionali (esclusi in ottica robogame in quanto non adatti)
  • Sparatutto (esclusi in quanto fin troppo sfruttati, sia dai robot che dai videogiochi)
  • Giochi di ruolo (esclusi a causa del numero limitato di robot in gioco)
  • Platform (esclusi perchè fisicamente poco realizzabili da un robot attuale)
  • Sportivi

Dopo aver escluso i generi non adatti, abbiamo considerato approfonditamente i due generi rimasti, e i loro limiti. Nel caso dei giochi sportivi, il limite è dato dalla necessità di avere un robot abbastanza dinamico, mentre i giochi strategici sono limitati dalla scarsa dinamicità di azione.

Uso della palla

Una prima distinzione all'interno dei giochi delle categorie considerate riguarda l'uso della palla.

  • I giochi con palla rendono il robot più complesso, ma sono immediati e coinvolgenti, e non pongono gravi problemi come la definizione di nascondiglio. Sono certamente semplici, intuitivi e dinamici. permettono di variare strategia, soprattutto se il gioco avviene con più agenti intelligenti in campo.
  • I giochi senza palla necessitano di robot in generale semplici, che richiedano al più velocità discrete. Sono meno coinvolgenti (anche se dipende dai gusti) e meno dinamici, o comunque se sono dinamici danno meno spazio a strategie pensate come “razionali” (se devo scappare da qualcuno... scappo) oppure paradossalmente prevedono l’introduzione di idee complesse, come quella di nascondiglio.

Un grosso problema legato all'uso della palla riguarda la velocità. Alcune idee per limitare la velocità della palla sono:

  • Uso dei palloncini
  • Uso di palline da tennis sgonfie, con l’obbligo di rimbalzo (urto anelastico che “assorbe” energia cinetica)
  • Uso di zone determinate per il gioco e porte.

Giochi strategici

Dei giochi strategici abbiamo considerato 3 sotto categorie:

  • Derivati dai giochi da tavolo. Esempio: labirinto magico (famoso gioco da tavolo in scatola), in cui magari il labirinto è fatto con segnali luminosi (se possibile) o in altro modo. Il labirinto magico è un labirinto che può cambiare configurazione in cui bisogna trovare degli oggetti (oppure potrebbe essere l’uscita... oppure il robot. Altri esempi: giochi come “battaglia navale” o altri giochi di strategia pensati.
  • Tower Defense. Un esempio di Tower defense potrebbe essere un gioco ispirato a Rock Of Ages, che consiste nel difendere il proprio castello dall’assalto di una palla demolitrice e comandare la palla contro quello dell’avversario. In questo caso il robot potrebbe svolgere la funzione della “roccia”, evitando gli ostacoli insormontabili, e travolgendo/distruggendo (ovvero spostando... o passandoci sopra) quelli che invece potrebbero solo rallentarlo, o che gli bloccano il passaggio fino a raggiungere l’obiettivo. Più robot possono cooperare contro più umani per l’assalto al “castello”, oppure si possono fare due o più squadre robot/umano e simulare una battaglia alla “Rock Of Ages”
  • Da bambini e/o di intelligenza: giochi “infantili” possono essere trova & nascondi (simili alla caccia al tesoro) distruggi & costruisci, oppure un gioco in cui l’obiettivo del robot siano alcuni oggetti, però il robot non deve farsi individuare dal giocatore che ha gli oggetti... e il giocatore deve portare i robot a tradirsi attraverso questi oggetti, posizionandoli adeguatamente nell’area di gioco, sfruttando fondamentalmente lo stesso concetto della pesca.

Design del gioco

In particolare sono state stese tre bozze di gioco, una (RoboTower) basata sull'idea di Tower Defense, che è poi stata effettivamente implementata, e due bozze, entrambe focalizzate sull'uso della palla. Delle bozze scartate, la prima consiste in un gioco sportivo simile al tennis, in cui il robot deve svolgere azioni limitate rispetto all'umano, la seconda consiste in un gioco ispirato ai giochi infantili e basato su un palloncino.

In generale, è preferibile pensare a giochi in cui i ruoli di giocatore e robot siano diversi (come nella bozza Tower Defense), il che permette di aggirare eventuali limitazioni del robot, se non sfruttarle a vantaggio dell’esperienza di gioco.

Un altro problema, oltre a quello già citato della velocità, legato ai giochi che utilizzano la palla, è la necessità da parte del robot di effettuare movimenti complessi: la palla deve infatti essere sollevata da terra, colpita (eventualmente al volo) e direzionata, causando problemi nell'implementazione con una precisione accettabile su un robot di tali comportamenti. Per tale motivo, le bozze impieganti la palla sono state scartate.

Nello sviluppo dello storyboard di RoboTower, è stata prestata particolare attenzione a quali aspetti del gioco siano completamente controllabili dalla logica di gioco e quali invece non sono controllabili in maniera efficiente e\o sufficientemente precisa, lasciando il compito di rispettare queste ultime regole alla "buona fede" del giocatore.

  • E’ stata accettata, almeno momentaneamente, l’idea del lancia-palle, usabile per abbattere sia la torre che le fabbriche. Il modo effettivo con cui queste strutture possono essere distrutte è ancora da discutere, e dipenderà dalle caratteristiche dello spara-palle.
  • Il gioco è stato progettato per essere sia facilmente espandibile, aumentando ad esempio il numero di robot o di torri da utilizzare, di conseguenza è possibile implementare versioni del gioco con più giocatori umani che collaborino con o contro più robot.