Lien processus sto. et événement ponctuel

Bonjour à tous et à toutes;

J'ai un problème avec des données que je dois analyser, d'un coté j'ai un ensemble de séries temporelles (dont les mesures sont prises simultanément et à intervalle régulier) et de l'autre des événements se produisant à des dates différentes (que j'appellerai des "tops").

Le but étant d'établir un lien entre le comportement des séries temporelles et l'avènement d'un "top" pour pouvoir par la suite établir une stratégie pour mettre le tout dans un algo (logistique ou autre).

Pour le contexte, les séries temporelles correspondent à des mouvements de sol par rapport à un point de ref (un peu partout sur la zone d'étude) et les tops sont des événements liés aux mouvements du sol touchant une structure (bâtiment ou route ou autre).

Les tops sont tous pareils, il n'y a pas plusieurs types de tops mais se produisant à des dates différentes.

La taille du jeu de données est considérable (quelques dizaines de milliers de séries temporelles) le tout pour quelques centaines d'événements, ce qui exclu toute analyse fine.

J'ai essayé plusieurs approches :
- Découper chaque série en fenêtres glissantes et attribuer à chaque série une variable catégorielle 0 ou 1 selon si l’enchaînement de mouvements conduit à un événement "aux alentours" (je n'ai toujours pas fixé une stratégie pour attribuer à chaque événement un ensemble de séries temporelles) et essayer un algo facile (comme une logistique) mais le résultat est catastrophique.

- Résumer les séries temporelles au voisinage d'un top en moyennant, ce qui me fait perdre beaucoup d'information et conduit aux mêmes résultats catastrophiques que précédemment

-Résumer les séries temporelles correspondant aux points de mesure proches géographiquement des tops par ACP, cette approche me paraît bonne car en analysant les données j'ai vu que la variance des mesures augmente brusquement à avant chaque top, donc en résumant par une ACP je donnerai plus de poids aux séries les plus volatiles. Mais je n'arrive pas à trouver une stratégie automatisée pour dire quand le top apparaîtra.

Avez-vous des idées pour attaquer ce type de problèmes ? Ou pour au moins pouvoir faire correspondre les différentes données pour mieux les cerner et commencer les analyses.

Merci beaucoup pour votre aide.

Réponses

  • Bonsoir,

    Il me semble que ton problème relève des méthodes d'analyse des données fonctionnelles en statistique mais il faut que j'ai une meilleure compréhension de ton post.

    Cordialement.
  • Bonjour jma,

    Je ne sais pas exactement ce que tu n'as pas compris dans mon post mais je vais essayer de reformuler en espérant que ça éclaircisse les choses.

    J'ai deux jeux de données :

    - Des points de mesure au sol décrivant le mouvement du sol, il y en a quelques dizaines de milliers un peu partout sur toute une région. Chaque point de mesure donne une série temporelle des mouvements du sol (par exemple le 1er janvier 2020 on a +5mm de mouvement). Les capteurs donnent leurs mesures simultanément et à intervalle régulier (i.e. les N séries temporelles sont indexées par les mêmes dates);

    - Des structures : Bâtiments, routes etc etc. Chacune de ces structures est endommagée par ce mouvement du sol, on dispose de la date à laquelle le dommage est survenu;

    - Chaque structure et chaque point de mesure est identifié par ses coordonnées GPS;

    Ma question était : comment attribuer un ensemble de points de mesure à chaque structure ? Comment faire pour dégager des signes pouvant déclencher un dommage aux structures sachant que je n'ai pas un échantillon témoin de structures non endommagées.

    Voilà j'espère que c'est claire, sincèrement c'est tout ce que j'ai compris de ma problématique, je suis un peu dans le flou.
  • Bonjour

    Entendu, je pense que c'est bien clair pour moi. Je dois réfléchir et me documenter. Je pense toujours aux méthodes d'analyse fonctionnelle intégrant soit une analyse discriminante soit une régression logistique. Est-ce que je me lance ?

    Cordialement.
  • Merci pour l'aide ! J'ai essayé une régression logistique mais je suis certain que je l'ai mal fait. Je continue à réfléchir, ton aide est la bienvenue!
  • Bonjour,

    Pour l'instant, je fais choux blanc. Je te contacterai en fin de semaine prochaine.

    Bon dimanche.
  • Bonjour,

    Je lis cet article qui est une revue d' articles concernant l'analyse fonctionnelle dans pas mal de domaine : https://bmcmedresmethodol.biomedcentral.com/articles/10.1186/1471-2288-13-43
    Tu pourras y voir que les auteurs insistent sur l'étude des séries chronologiques dans ce contexte. Pourrais-tu le lire pour me dire ce que tu en penses ?

    Cordialement.

    Ajout : L'esprit de l'escalier (qui m'a fait rater une marche dans celui de l'à-propos :-)) me fait me demander qu'il y a des tops mais, est-ce que l'on sait quelles structures les ont subis (ponts, immeubles, canalisations,..) ? Si oui, il est possible de faire une classification des séries temporelles suivant les types de structures.
Connectez-vous ou Inscrivez-vous pour répondre.