The Thesis concerns the management and analysis of mobility data. The pervasiveness of geo-positioning technologies, sensors and communication networks has led to the collection of large amounts of data on the movement of objects. A major issue is thus how to effectively organize and access such a data. An important category of mobility data is that of spatial trajectories. A spatial trajectory describes the continuous movement of an object in a reference space, e.g. the Euclidean plane, through a set of temporally annotated and ordered sample points. Spatial trajectories can represent the movement of vehicles, people and animals, for example equipped with a GPS receiver. Yet, spatial trajectories can represent the movement exclusively in terms of locations, thus the evolution of the context in which the movement takes place is ignored. In general, the contextual data can be acquired directly from the environment, for example through the use of sensors, or be the result of an analytical process. In this sense, spatial trajectories lack expressivity. An important step towards the specification of richer and more expressive data models, is the symbolic trajectories data model. This model allows for the representation of sequences of activities (or labels), each annotated with a time period. A major novelty of the model is the query language that is based on pattern matching. Nevertheless also this solution presents important limitations because the notion of symbolic trajectory is orthogonal to that of spatial trajectory and thus does not include any location information. The Thesis addresses the problem of integrating the spatial dimension with the symbolic one, providing as well a mechanism enabling the efficient access to a database of spatio-textual trajectories. The major contribution of this research is the proposal of a framework for the indexing of spatio-textual trajectories The goal of the index is to support the processing of queries taking the form of Sequenced queries, that is complex queries expressed as sequences of ordered simple spatio-textual queries. The index is called IRWI. The system is hybrid in that it combines an R-tree for the indexing of spatial trajectory segments with inverted files for the indexing of the textual part. A Sequenced query is next processed in parallel, evaluating first every single query of the sequence, and finally analyzing and recomposing the sequence. A related though different topic of the Thesis regards the study of techniques for mobility data analysis. The objective is to extract behavioral patterns from spatial trajectories and next represent them in terms of spatio-textual trajectories. The major contribution is the definition of an algorithm for the segmentation of the trajectories based on clustering and relying on a novel model of noise. Finally, a case study illustrates and summarizes the methodology proposed for the analysis and representation of mobility data. Specifically the above segmentation technique is used for the extraction of the migratory behavior of a group of animals equipped with GPS collars. Next such a knowledge is encoded in terms of spatio-textual trajectories. The results of this research, spanning data representation and analysis, have been presented in conferences and journals.

L'argomento della Tesi riguarda la gestione e analisi di dati di mobilità . La pervasività delle tecnologie per la geolocalizzazione, sensori e reti di comunicazione, ha reso possibile l’acquisizione di grandi quantità di dati sul movimento di oggetti, da cui la necessità di tecniche che consentano l’organizzazione e l’accesso efficiente ai dati. Una classe importante di dati di mobilità è costituita dalle traiettorie spaziali. Una traiettoria spaziale descrive il movimento continuo di un oggetto in uno spazio di riferimento, e.g. spazio Euclideo, tramite un sequenza di punti campione, temporalmente annotati e ordinati. Le traiettorie spaziali possono descrivere ad esempio il movimento di veicoli, individui o animali, equippaggiati con un ricevitore GPS. Le traiettorie spaziali, tuttavia, descrivono il movimento unicamente in termini di posizione mentre non permettono di descrivere l’evoluzione nel tempo del contesto piu’ ampio in cui il movimento ha luogo. I dati di contesto possono essere acquisiti direttamente dall’ambiente, ad esempio tramite l’uso di sensori, oppure ottenuti dall’applicazione di tecniche analitiche. In questo senso le traiettorie spaziali difettano di espressività. Un passo importante nella direzione di modelli piu’ ricchi ed espressivi è costituito dal modello delle traiettorie ‘simboliche’. Questo modello permette di descrivere sequenze di attività tramite etichette, ognuna annotata da un intervallo temporale. L’aspetto piu’ innovativo del modello riguarda lo sviluppo di un linguaggio di interrogazione basato su pattern matching. Anche questa soluzione presenta tuttavia importanti limiti perchè le traiettorie simboliche sono completamente ortogonali a quelle spaziali e quindi ignorano il dato di posizione. Questa Tesi affronta il problema della integrazione della dimensione spaziale con quella simbolica per un accesso efficiente a database di traiettorie denominate spazio-testuali. Il contributo piu’ significativo e’ un sistema per la indicizzazione di traiettorie spazio-testuali a supporto delle interrogazioni di tipo Sequenced Queries, ossia queries espresse come sequenze ordinate di queries elementari spazio-testo. Il sistema si chiama IRWI, e’ un sistema di indici ibrido che combina un indice basato su R-tree per la indicizzazione dei segmenti di traiettoria con un indice basato su inverted file per la indicizzazione dela componente testuale. Il processamento delle query viene effettuato in parallelo valutando le singole queries della sequenza e poi alla fine ricomponendo le sequenze. Un secondo aspetto trattato nella tesi riguarda lo studio di tecniche per l’analisi dei dati di movimento. L’obiettivo è quello di estrarre pattern comportamentali dalle traiettorie spaziali per poi rappresentarli in termini di traiettorie spazio-testuali. Il contributo più significativo è la definizione di un algoritmo di segmentazione delle traiettorie che sfrutta tecniche di clustering con un nuovo modello di noise. In ultimo, è stato realizzato un caso di studio che illustra e riassume la metodologia proposta per l’ analisi e rappresentazione del movimento. La tecnica di segmentazione di cui sopra è stata utilizzata per l’estrazione da traiettorie spaziali del comportamento migratorio di animali equipaggiati con collari GPS. Questa conoscenza è stata poi espressa in termini di traiettorie spazio-testuali. Complessivamente, i risultati della ricerca hanno dato luogo a diverse pubblicazioni in riviste e a conferenze.

SPATIO-TEXTUAL TRAJECTORIES: MODELS AND APPLICATIONS / H. Issa ; supervisor: M. L. Damiani. - : . DIPARTIMENTO DI INFORMATICA, 2017 Feb 27. ((28. ciclo, Anno Accademico 2015. [10.13130/issa-hamze_phd2017-02-27].

SPATIO-TEXTUAL TRAJECTORIES: MODELS AND APPLICATIONS

H. Issa
2017-02-27

Abstract

L'argomento della Tesi riguarda la gestione e analisi di dati di mobilità . La pervasività delle tecnologie per la geolocalizzazione, sensori e reti di comunicazione, ha reso possibile l’acquisizione di grandi quantità di dati sul movimento di oggetti, da cui la necessità di tecniche che consentano l’organizzazione e l’accesso efficiente ai dati. Una classe importante di dati di mobilità è costituita dalle traiettorie spaziali. Una traiettoria spaziale descrive il movimento continuo di un oggetto in uno spazio di riferimento, e.g. spazio Euclideo, tramite un sequenza di punti campione, temporalmente annotati e ordinati. Le traiettorie spaziali possono descrivere ad esempio il movimento di veicoli, individui o animali, equippaggiati con un ricevitore GPS. Le traiettorie spaziali, tuttavia, descrivono il movimento unicamente in termini di posizione mentre non permettono di descrivere l’evoluzione nel tempo del contesto piu’ ampio in cui il movimento ha luogo. I dati di contesto possono essere acquisiti direttamente dall’ambiente, ad esempio tramite l’uso di sensori, oppure ottenuti dall’applicazione di tecniche analitiche. In questo senso le traiettorie spaziali difettano di espressività. Un passo importante nella direzione di modelli piu’ ricchi ed espressivi è costituito dal modello delle traiettorie ‘simboliche’. Questo modello permette di descrivere sequenze di attività tramite etichette, ognuna annotata da un intervallo temporale. L’aspetto piu’ innovativo del modello riguarda lo sviluppo di un linguaggio di interrogazione basato su pattern matching. Anche questa soluzione presenta tuttavia importanti limiti perchè le traiettorie simboliche sono completamente ortogonali a quelle spaziali e quindi ignorano il dato di posizione. Questa Tesi affronta il problema della integrazione della dimensione spaziale con quella simbolica per un accesso efficiente a database di traiettorie denominate spazio-testuali. Il contributo piu’ significativo e’ un sistema per la indicizzazione di traiettorie spazio-testuali a supporto delle interrogazioni di tipo Sequenced Queries, ossia queries espresse come sequenze ordinate di queries elementari spazio-testo. Il sistema si chiama IRWI, e’ un sistema di indici ibrido che combina un indice basato su R-tree per la indicizzazione dei segmenti di traiettoria con un indice basato su inverted file per la indicizzazione dela componente testuale. Il processamento delle query viene effettuato in parallelo valutando le singole queries della sequenza e poi alla fine ricomponendo le sequenze. Un secondo aspetto trattato nella tesi riguarda lo studio di tecniche per l’analisi dei dati di movimento. L’obiettivo è quello di estrarre pattern comportamentali dalle traiettorie spaziali per poi rappresentarli in termini di traiettorie spazio-testuali. Il contributo più significativo è la definizione di un algoritmo di segmentazione delle traiettorie che sfrutta tecniche di clustering con un nuovo modello di noise. In ultimo, è stato realizzato un caso di studio che illustra e riassume la metodologia proposta per l’ analisi e rappresentazione del movimento. La tecnica di segmentazione di cui sopra è stata utilizzata per l’estrazione da traiettorie spaziali del comportamento migratorio di animali equipaggiati con collari GPS. Questa conoscenza è stata poi espressa in termini di traiettorie spazio-testuali. Complessivamente, i risultati della ricerca hanno dato luogo a diverse pubblicazioni in riviste e a conferenze.
DAMIANI, MARIA LUISA
The Thesis concerns the management and analysis of mobility data. The pervasiveness of geo-positioning technologies, sensors and communication networks has led to the collection of large amounts of data on the movement of objects. A major issue is thus how to effectively organize and access such a data. An important category of mobility data is that of spatial trajectories. A spatial trajectory describes the continuous movement of an object in a reference space, e.g. the Euclidean plane, through a set of temporally annotated and ordered sample points. Spatial trajectories can represent the movement of vehicles, people and animals, for example equipped with a GPS receiver. Yet, spatial trajectories can represent the movement exclusively in terms of locations, thus the evolution of the context in which the movement takes place is ignored. In general, the contextual data can be acquired directly from the environment, for example through the use of sensors, or be the result of an analytical process. In this sense, spatial trajectories lack expressivity. An important step towards the specification of richer and more expressive data models, is the symbolic trajectories data model. This model allows for the representation of sequences of activities (or labels), each annotated with a time period. A major novelty of the model is the query language that is based on pattern matching. Nevertheless also this solution presents important limitations because the notion of symbolic trajectory is orthogonal to that of spatial trajectory and thus does not include any location information. The Thesis addresses the problem of integrating the spatial dimension with the symbolic one, providing as well a mechanism enabling the efficient access to a database of spatio-textual trajectories. The major contribution of this research is the proposal of a framework for the indexing of spatio-textual trajectories The goal of the index is to support the processing of queries taking the form of Sequenced queries, that is complex queries expressed as sequences of ordered simple spatio-textual queries. The index is called IRWI. The system is hybrid in that it combines an R-tree for the indexing of spatial trajectory segments with inverted files for the indexing of the textual part. A Sequenced query is next processed in parallel, evaluating first every single query of the sequence, and finally analyzing and recomposing the sequence. A related though different topic of the Thesis regards the study of techniques for mobility data analysis. The objective is to extract behavioral patterns from spatial trajectories and next represent them in terms of spatio-textual trajectories. The major contribution is the definition of an algorithm for the segmentation of the trajectories based on clustering and relying on a novel model of noise. Finally, a case study illustrates and summarizes the methodology proposed for the analysis and representation of mobility data. Specifically the above segmentation technique is used for the extraction of the migratory behavior of a group of animals equipped with GPS collars. Next such a knowledge is encoded in terms of spatio-textual trajectories. The results of this research, spanning data representation and analysis, have been presented in conferences and journals.
Settore INF/01 - Informatica
SPATIO-TEXTUAL TRAJECTORIES: MODELS AND APPLICATIONS / H. Issa ; supervisor: M. L. Damiani. - : . DIPARTIMENTO DI INFORMATICA, 2017 Feb 27. ((28. ciclo, Anno Accademico 2015. [10.13130/issa-hamze_phd2017-02-27].
Doctoral Thesis
File in questo prodotto:
File Dimensione Formato  
phd_unimi_R10366.pdf

accesso aperto

Tipologia: Tesi di dottorato completa
Dimensione 4.52 MB
Formato Adobe PDF
4.52 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

Caricamento pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: http://hdl.handle.net/2434/472785
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact