Informations

Quels sont quelques exemples de réseaux pondérés non orientés en écologie ?

Quels sont quelques exemples de réseaux pondérés non orientés en écologie ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je suis une majeure en mathématiques avec un intérêt actuel pour la théorie des réseaux. UNE réseau peut être considéré comme un ensemble de nœuds, et bords entre ces nœuds signifiant une relation entre eux. L'exemple le plus omniprésent serait un réseau social comme Facebook avec des nœuds représentant des personnes et un bord reliant deux nœuds s'ils sont amis.

Un réseau s'appelle dirigé si les bords ont une direction. Cela signifie que s'il y a un bord dirigé de A vers B, ce n'est pas la même chose qu'un bord de B vers A. Un exemple de ceci serait un réseau de chaîne alimentaire, où les nœuds représentent les espèces et un bord des espèces A à B signifie que A mange B. Évidemment, cela ne signifie pas nécessairement qu'il y a un avantage de B à A (rarement la proie mange le prédateur).

Un réseau s'appelle non dirigé s'il n'est pas orienté, c'est-à-dire qu'aucun des bords n'a de direction ; s'il y a une arête de A vers B, cela signifie nécessairement qu'il y a une arête de B vers A.

Maintenant, on peut attribuer poids (valeurs numériques) aux tronçons d'un réseau pour indiquer l'importance relative des tronçons. Dans l'exemple Facebook ci-dessus, cela peut être considéré comme semblable à l'attribution de valeurs aux limites qui indiquent la force de l'amitié/la distance entre les résidences d'amis, etc.

Je souhaite étudier les réseaux écologiques pour voir si je peux tirer des conclusions intéressantes de mon étude des réseaux pondérés.

Alors pouvez-vous me donner quelques exemples de réseaux écologiques non orientés et pondérés?


L'épidémiologie, la propagation des maladies, est probablement l'une des applications les plus célèbres de la théorie des réseaux en biologie, remontant à John Snow.

Un exemple plus pertinent serait peut-être quelque chose comme des modèles graphiques de mosaïques d'habitats. Les populations sont souvent à la fois dispersées dans les paysages et regroupées dans de plus petites poches d'habitats convenables. Bien que fragmentées, ces populations ont encore un certain nombre de contacts, ce qui entraîne un flux de gènes et la création de ce qu'on appelle souvent une métapopulation. Ces choses peuvent se produire sur une vaste gamme d'échelles, de votre arrière-cour à des continents entiers, mais en les modélisant comme des graphiques, elles peuvent toutes être étudiées de manière comparative et testées pour la résilience face aux perturbations, à la perte d'habitat, etc.

Vous mentionnez les réseaux sociaux, mais il n'y a aucune raison pour que vous ne puissiez pas étudier la même chose dans les populations animales. Supposons qu'un individu apprenne quelque chose d'utile, peut-être l'emplacement et l'itinéraire vers une aire d'alimentation riche. Ces informations peuvent ensuite être partagées avec d'autres individus, soit par démonstration, soit par une sorte de communication abstraite. L'information se propage de manière exponentielle familière jusqu'à ce que tout le monde le sache, alors n'importe lequel de ces individus peut être relayé ou être "lâché" par une population voisine, il n'est même pas nécessaire qu'il s'agisse de la même espèce dans certains cas, et l'information circule de nouveau. Comme pour les mosaïques d'habitats, l'avantage de ces modèles est que des systèmes très différents peuvent être comparés et testés sur un pied d'égalité, tout, des poissons aux oiseaux, en passant par les mammifères et même certains insectes sociaux, s'y prête bien.


L'écologie des réseaux dans les paysages dynamiques

L'écologie des réseaux est un domaine émergent qui permet aux chercheurs de conceptualiser et d'analyser les réseaux écologiques et leur dynamique. Ici, nous nous concentrons sur la dynamique des réseaux écologiques en réponse aux changements environnementaux. Plus précisément, nous formalisons la manière dont les topologies de réseaux contraignent la dynamique des systèmes écologiques dans un cadre unificateur en écologie des réseaux que nous appelons « cadre de la dynamique des réseaux écologiques ». Ce cadre souligne que l'interaction entre les réseaux d'interaction des espèces et la disposition spatiale des parcelles d'habitat est essentielle pour identifier les propriétés du réseau (nombre et poids des nœuds et des liens) et les compromis entre eux sont nécessaires pour maintenir les interactions des espèces dans les paysages dynamiques. Nous concluons que pour être fonctionnels, les réseaux écologiques doivent être dimensionnés en fonction des capacités de dispersion des espèces en réponse à l'hétérogénéité du paysage. Déterminer comment ces réseaux écologiques efficaces changent dans l'espace et dans le temps peut aider à révéler leur dynamique complexe dans un monde en mutation.

1. Introduction

Des sciences de la vie aux mathématiques, en passant par les sciences sociales, l'informatique et la physique, la théorie des réseaux est devenue un outil d'analyse universel pour conceptualiser, visualiser et modéliser les relations (arêtes ou liens) entre les éléments discrets (nœuds) de systèmes complexes [1]. L'attrait de la théorie des réseaux dans toutes ces disciplines provient de sa représentation intuitive des systèmes et de sa flexibilité pour modéliser et étudier la force des relations (par exemple, des liens pondérés) entre les nœuds (par exemple, des entités, des points, des espèces, des populations, des parcelles).

En écologie, la théorie des réseaux a été utilisée avec succès pour étudier tous les aspects de l'histoire de la vie, des relations et des flux des espèces : interactions entre les espèces et dispersion des réseaux trophiques et migration métapopulation, dynamique des métacommunautés et des métaécosystèmes épidémies d'insectes et invasions épidémiques et propagation des maladies. Il n'est donc pas surprenant qu'au cours des dernières décennies, l'écologie des réseaux ait émergé comme une discipline intégrée visant à analyser, simplifier et modéliser la complexité écologique jusqu'à ses composants essentiels afin de comprendre la dynamique du système [2–10].

Ici, nous examinons comment les réseaux écologiques peuvent être analysés, comparés et modélisés à l'aide de la théorie des réseaux. Plus précisément, nous mettons en évidence le potentiel des réseaux multicouches pour répondre à un large éventail de questions sur la dynamique des entités écologiques et leurs relations dans un monde en mutation. Ensuite, nous soulignons l'importance de reconnaître comment les topologies de réseau contraignent la dynamique des systèmes écologiques en tant que cadre unificateur dans l'écologie des réseaux que nous appelons le « cadre de la dynamique des réseaux écologiques ». Ce cadre souligne que l'interaction entre les topologies inhérentes des réseaux d'interaction des espèces et la disposition spatiale des réseaux de parcelles d'habitat est essentielle pour identifier quelles propriétés de réseau (nombre et poids des nœuds, liens) et les compromis entre eux sont nécessaires pour maintenir les interactions entre les espèces. dans des paysages dynamiques. Nous terminons en soulignant la nécessité d'estimer l'interaction directe et indirecte, ainsi que les rétroactions, entre les réseaux d'interaction des espèces et les réseaux spatiaux des parcelles d'habitat tout en tenant compte de la capacité de dispersion des espèces tout au long de leur cycle de vie, des déplacements quotidiens dans leur domaine vital à la dispersion et à la migration. [11–13]. Ce faisant, les écologistes seront en mesure de modéliser la manière dont les réseaux écologiques fonctionnels répondent aux effets de la dynamique du paysage dans un monde en évolution rapide.

2. Réseaux écologiques

Dans les réseaux d'interaction d'espèces (ci-après réseaux d'interaction), les nœuds sont des espèces et les liens entre eux sont des interactions : liens trophiques dans les réseaux trophiques [14], relations mutualistes modélisées par des réseaux bi- et multipartites (pollinisation, dispersion des graines, microbiomes intestinaux) [ 2,15,16] (figure 1une), interactions antagonistes (prédation, herbivore, parasitisme), entre autres.

Figure 1. Exemple de réseaux écologiques : (une) espèces en tant que nœuds : réseau multipartite avec des interactions indiquées par des arêtes dirigées entre les ensembles (pas d'arêtes dans un ensemble), et (b) patchs en tant que nœuds : réseau spatio-temporel en tant que réseau multicouche avec la matrice de supra-adjacence correspondante. Chaque couche est un temps, les bords dirigés intra-couche indiquent la dispersion Les bords inter-couches indiquent les dépendances d'une couche à l'autre. (Version en ligne en couleur.)

Les réseaux d'interaction peuvent être représentés et modélisés comme des réseaux multicouches (figure 1) qui sont composés de plusieurs réseaux monocouches où chaque monocouche contient des nœuds connectés via des liens intracouches, avec des liens intercouches (souvent des bords dirigés) reliant les nœuds d'une monocouche à une autre [17-24 ] (Figure 1b). Les réseaux multicouches fournissent donc un cadre puissant pour visualiser et modéliser la façon dont les réseaux d'interaction varient dans l'espace et le temps, comme présenté dans les sections suivantes.

3. Dynamique et évolution du réseau

Dynamique au le réseau : où les nœuds restent au même endroit d'une monocouche à l'autre, mais leurs poids ou états changent, et les arêtes restent fixes bien que leurs poids puissent changer. Une telle dynamique peut être analysée à l'aide de réseaux spatio-temporels où du temps 1 au temps 2 (voir §4) : (i) la maladie peut se propager [7], ou (ii) les chemins de dispersion entre les parcelles d'habitat peuvent varier en capacité ou en utilisation, selon aux états et poids des patchs, altérant la connectivité fonctionnelle [30]

Dynamique de le réseau : où le nombre et les états des nœuds peuvent changer, et les liens peuvent apparaître ou disparaître ainsi que changer de poids [31]. De telles dynamiques peuvent être analysées à l'aide de réseaux spatio-temporels (voir §4) où du temps 1 au temps 2 : (i) les interactions des espèces se reconnectent (c'est-à-dire les liens changeants entre les nœuds) [32], ou (ii) les routes de dispersion disponibles entre les parcelles d'habitat former des réseaux spatiaux, changer par la perte ou le gain de bords, altérer la connectivité structurelle. De plus, dans les paysages dynamiques, la topologie globale des réseaux spatiaux de parcelles d'habitat peut changer à mesure que des nœuds (pièces d'habitat) sont perdus ou gagnés, ce qui à son tour affecte les interactions des espèces et leurs capacités à se disperser [33].

Ces deux types de dynamique de réseau (au et de) peuvent se produire indépendamment ou de concert, de sorte que les réseaux peuvent évoluer dans le temps de manières nombreuses et complexes.

La dynamique du réseau peut être modélisée à l'aide de diverses matrices (par exemple, contiguïté, laplacienne ou jacobienne) qui représentent différentes propriétés écologiques et de réseau [1,34,35]. Ensuite, la stabilité des propriétés des réseaux dans le temps peut être évaluée en comparant les propriétés spectrales de leurs matrices topologiques (par exemple, les changements de leurs valeurs propres).

La dynamique du réseau peut être modélisée à l'aide de matrices de probabilité dans les modèles d'état et de transition [36] où les parcelles d'habitat dans un paysage dynamique ont des états différents (par exemple, une qualité d'habitat faible/élevée, des peuplements forestiers pionniers/matures) et des transitions régies par un Markov de premier ordre. chaîne à probabilités constantes. Dans ce schéma, tous les patchs suivent la même séquence d'états, bien qu'éventuellement à des rythmes très différents, déterminés par les probabilités de transitions.

La dynamique des réseaux spatiaux et les transitions entre états dépendent cependant souvent de conditions plus lointaines dans le passé que l'état immédiatement précédent et d'états de voisins spatiaux, aussi bien plus éloignés que proches (le contexte spatial). Par conséquent, l'historique des patchs à plus long terme, les effets de voisins plus éloignés ou la non-stationnarité (qu'elle soit temporelle ou spatiale) doivent être pris en compte lors de la modélisation de la dynamique des réseaux écologiques. De plus, étant donné que les systèmes écologiques sont affectés par de multiples processus externes, les transitions d'état dépendent d'une histoire à plusieurs étapes et d'un contexte spatial au-delà des voisins de premier ordre, les réseaux spatiaux nécessitent des approches de modélisation plus flexibles.

4. Réseaux spatio-temporels

Nous pouvons tester des hypothèses sur les processus sous-jacents qui affectent la topologie et la fonction du réseau en utilisant des réseaux spatio-temporels (c. ,33,37,38].

Les réseaux spatio-temporels sont un cas particulier des réseaux multicouches (figure 1b) où des liens spatiaux et temporels peuvent apparaître et disparaître. Par exemple, les réseaux spatio-temporels peuvent avoir des liens à la fois spatiaux et temporels qui se rapprochent des chemins des animaux lorsqu'ils se déplacent à travers des paysages fragmentés. Pour les phénomènes de courte durée, tels que les éclairs, il n'y a pas de liens intra-individuels possibles car aucun individu distinct ne persiste entre les périodes de temps, mais les liens entre les événements peuvent être soit purement instances des mêmes emplacements avec des frappes à intervalles de temps successifs), ou un mélange des deux (création de réseaux spatio-temporels d'agrégations).

Les réseaux spatio-temporels peuvent également être utilisés pour analyser les probabilités d'état et de transition associées aux processus écologiques, aux interactions entre espèces, à la propagation d'espèces envahissantes, aux épidémies d'insectes ou à la propagation de maladies. Par exemple, Grillet et al. [39] ont utilisé des réseaux spatio-temporels pour développer une série d'indices de transition d'état basés sur des données « d'incidence/non-incidence » permettant la quantification des différents modèles spatio-temporels de propagation du paludisme au Venezuela. de la Fuente [40] a utilisé le modèle de connectivité généralisé [41] pour prédire la propagation d'un ravageur envahissant et à partir de cette analyse, il a proposé une stratégie de gestion pour limiter la propagation du ravageur. Boulanger et al. [42] ont utilisé des réseaux spatiaux pour évaluer la dispersion potentielle d'une espèce sur plusieurs générations.

La dimension temporelle est une caractéristique nécessaire des réseaux spatio-temporels pour se concentrer sur l'importance du changement. Ici, les nœuds peuvent représenter des individus, des espèces ou des parcelles d'habitat tandis que les liens entre les nœuds sont leurs actions ou dépendances (en tant que liens dirigés) d'une période à l'autre [27,43-46]. L'étude des systèmes écologiques dynamiques à l'aide de données de séries chronologiques [45,46] est essentielle à notre compréhension de la mesure dans laquelle les processus écologiques passés affectent les processus actuels et futurs, en faisant avancer certaines caractéristiques à travers un certain nombre d'itérations ou de périodes d'observation. Les nœuds peuvent être de courte durée (une seule observation à un moment donné) ou ils peuvent être persistants (plusieurs périodes d'observation ou étapes temporelles), et les organismes peuvent également être sessiles (par exemple les arbres) ou mobiles (par exemple les mammifères). Lorsque les nœuds sont sessiles, les liens peuvent rejoindre des instances du même nœud à des moments différents, donnant des liens orientés uniquement dans le temps. Les réseaux temporels sont donc couramment utilisés pour étudier les changements dans la phénologie [27,32,47] ou les effets de la mémoire du paysage dans les systèmes écologiques [48].

Les nœuds changent d'état (par exemple, sains à malades)

Les nœuds changent de poids (par exemple, la densité de population augmente)

Les bords changent de position (par exemple, deux pollinisateurs échangent leurs deux interactions entre deux plantes différentes)

Les bords changent de poids (par exemple, le débit d'eau entre les lacs change avec la saison)

Les nœuds et les liens changent de poids (par exemple, la profondeur du lac et le débit de la rivière diminuent tous les deux).

Étant donné que les nœuds et les liens peuvent varier, les réseaux spatio-temporels peuvent être modélisés en une seule étape (par exemple, la matrice de supra-adjacence dans la figure 1b) ou k-pas de mémoire temporelle, et plus proches voisins spatiaux ou kème ordre des voisins relatifs (par exemple les nœuds qui sont liés par un autre nœud et plus d'un bord) [49]. La détermination des unités spatiales et temporelles à utiliser soulève des questions importantes à considérer lors de la modélisation et de l'interprétation des réseaux spatio-temporels. Premièrement, il y a rarement une vraie commensurabilité pour les dimensions du temps et de l'espace (comment une distance spatiale dans un réseau peut-elle se traduire en « distance » d'un réseau temporel dans le temps ?). Ce manque de commensurabilité nécessite la prise en compte de la dimensionnalité du système écologique à l'étude car l'échelle spatiale et l'échelle temporelle dépendront toutes deux des processus sous-jacents qui affectent la topologie et la fonction du réseau. Par conséquent, l'analyse spatio-temporelle nécessite de faire correspondre le pas de temps avec les processus et les événements qui modifient soit les nœuds, soit les liens, soit les deux. La période de ces pas de temps peut être déterminée par des événements externes tels que des perturbations et des changements d'utilisation des terres, ainsi que par des processus internes tels que la dynamique des populations, la succession et la dispersion, ou par les réponses décalées des espèces aux synergies d'événements externes et de processus internes. . Par exemple, en raison de la dynamique des parcelles, il existe souvent une fenêtre de connectivité dans le temps qui permet aux espèces d'atteindre les parcelles d'habitat avant qu'elles ne soient perdues ou indisponibles. Ainsi, pour déterminer l'importance de la dimension temporelle dans l'évaluation de la connectivité, Martensen et al. [33] ont développé un algorithme de réseau spatio-temporel qui tient compte à la fois de la capacité de dispersion d'un organisme et d'une fenêtre de connectivité temporelle donnée. Ces fenêtres temporelles peuvent être définies pour correspondre aux événements de dispersion ou à la longévité d'une espèce. Ensuite, les trois métriques de probabilité spatio-temporelle de connectivité [33] peuvent être calculées pour déterminer l'importance relative de la persistance de la parcelle, la disponibilité de parcelles de tremplin ou la capacité d'atteindre des parcelles d'habitat directement dans des paysages dynamiques.

5. Propriétés du réseau

Pour comparer des réseaux, des métriques de réseau et des modèles théoriques peuvent être utilisés au niveau de l'élément (nœuds, liens) [38,50], au niveau du sous-réseau (motifs ou graphlets) ou au niveau du réseau [1,35]. Au niveau du réseau, les propriétés du réseau peuvent être quantifiées à l'aide de propriétés de graphe spectral [35] ou de métriques de réseau (imbrication, modularité, connectance, classe de parti-bi-, multi-partite) pour caractériser les relations entre deux ou plusieurs sous-ensembles d'espèces [4, 21,51]. Ensuite, la distribution observée du degré des nœuds peut être comparée à celles de modèles théoriques tels que aléatoire, sans échelle ou petit monde [3,10], ou avec des modèles de graphes aléatoires exponentiels [52]. De plus, les propriétés structurelles du réseau peuvent être testées par rapport à des réseaux simulés basés sur des modèles nuls ou la théorie des réseaux de percolation [1,4,31,37,52,53] qui tiennent compte du nombre de nœuds, du nombre de liens et de la configuration spatiale de le réseau. Les modèles nuls basés sur les processus [53, 54] qui tiennent compte des effets dynamiques des topologies de réseau, peuvent également être utilisés à des fins de comparaison, en évaluant comment les réseaux d'interaction diffèrent en fonction de divers cadres théoriques (par exemple, modèles aléatoires, de niche et en cascade). La comparaison des propriétés de réseau observées avec celles dérivées de modèles connus est une étape importante pour comprendre les processus qui affectent les systèmes que nous étudions. Dans les réseaux multicouches, non seulement les propriétés du réseau intracouche doivent être testées par rapport à certaines structures de réseau nulles ou restreintes (par exemple en gardant la même connectivité, en gardant le même degré de distribution) qui tiennent compte des topologies et des contraintes du réseau, mais il en va de même des propriétés intercouches entre nœuds dans différentes couches (par exemple nœuds et liens pondérés, modularité spatiale, décalages temporels, structure trophique).

Les réseaux écologiques ne doivent pas être comparés à l'aide d'une seule propriété de réseau (par exemple, distribution de degré de nœud ou présence de cycles) car deux réseaux peuvent avoir la même distribution de degré mais différer par d'autres caractéristiques telles que le diamètre ou le nombre de cycles. Il faut donc toujours déterminer a priori quelles propriétés du réseau sont pertinentes pour les hypothèses à l'étude (par exemple, longueurs de chemin, modularité, connectivité, centralité des nœuds). Par exemple, avec les réseaux spatiaux, on pourrait se concentrer sur la comparaison de la longueur du chemin, de la redondance des chemins et de la zone accessible en fonction de la plage de dispersion d'un organisme [50].

Au niveau du sous-réseau, la caractérisation des réseaux d'interaction peut être analysée en évaluant la récurrence de petits sous-réseaux de base, comme ceux appelés « motifs » [55,56]. Milo et al. [55] ont proposé des motifs basés sur des sous-réseaux pondérés à 3 nœuds correspondant à des interactions d'espèces spécifiques (par exemple, compétition, prédation). Les motifs ont été utilisés pour comparer les changements dans les interactions entre les espèces le long des gradients environnementaux [57] ou la position trophique des espèces dans les réseaux trophiques [58]. Les motifs à 3 nœuds font partie de la famille des approches de graphlets [3,10,59]. L'analyse des graphlets comprend à la fois des sous-réseaux non orientés et dirigés, appelés graphlets, permettant de caractériser les positions de n'importe quel nœud parmi l'ensemble des positions équivalentes définies sur ces sous-réseaux.

Au niveau de l'élément, les attributs d'un nœud peuvent être évalués (centralité d'intermédiarité, centralité de vecteur propre, etc. [3,10]) y compris les niveaux trophiques des espèces (nœuds) [14]. Dans certaines circonstances, la position exacte d'un nœud (par exemple, une espèce) dans un sous-réseau pourrait fournir des informations sur la dynamique des interactions entre espèces [58]. Les motifs et les graphlets orientés peuvent le faire en déterminant la position équivalente d'un nœud individuel dans un graphlet connu sous le nom d'orbite [3,10,59]. Matériel électronique supplémentaire, la figure S1 illustre le potentiel des graphlets dirigés [59] pour identifier les changements dans la fréquence des orbites (par exemple, les espèces) au fil du temps lorsqu'un niveau trophique est modifié ou supprimé. Dans cet exemple, les fréquences de différentes longueurs d'interactions antagonistes sont les plus courantes (graphlets à 3 et 4 nœuds). Les graphlets dirigés pourraient donc aider à analyser des interactions plus complexes telles que celles trouvées en bioinformatique et en médecine avec des moyens comparables d'aligner des réseaux [60] et en écologie pour des interactions trophiques plus complexes (e.g. omnivory [61]).

6. Déduire les réseaux d'interaction

La théorie des réseaux repose souvent sur l'hypothèse que tous les nœuds pertinents du réseau à l'étude sont inclus [1]. Cependant, cette hypothèse est rarement respectée dans les réseaux d'interaction écologique car ils sont échantillonnés en ciblant des taxons particuliers ou des types d'interactions spécifiques (par exemple, les interactions mutualistes dans les réseaux plantes-pollinisateurs), sans tenir compte du contexte du reste de la communauté dans lequel ces interactions se produisent.

Comme la plupart des réseaux d'interaction ne sont échantillonnés qu'une seule fois, leur variabilité dans l'espace ou dans le temps ne peut être déterminée [62]. De plus, l'échantillonnage a tendance à manquer des espèces/nœuds rares et des interactions/liens rares par paires. Un tel échantillonnage incomplet et éventuellement biaisé des réseaux d'interaction a entraîné des estimations inexactes des topologies de réseau [63,64]. Des descriptions plus complètes des interactions entre espèces via des observations supplémentaires de séries chronologiques d'abondances d'espèces sont donc nécessaires pour mieux déduire les réseaux d'interaction.

Souvent, les réseaux d'interaction sont construits en supposant que les espèces coexistant à un endroit ont une interaction même si elle n'est pas observée. Cette approche a été critiquée car les données de présence/absence peuvent être un mauvais indicateur des interactions entre les espèces [65]. De nouvelles approches reposent plutôt sur des données d'abondance des espèces pour déterminer les interactions entre les espèces [32]. L'hypothèse centrale de ces approches est que si les espèces ont des interactions, leurs abondances doivent être liées, après contrôle des facteurs abiotiques.

Dans un réseau multicouche, toutes les difficultés d'évaluation de la topologie et des interactions intracouches à un seul pas de temps prévalent ainsi que celles de l'évaluation des poids des bords intercouches ou des changements de poids des nœuds. Jusqu'à présent, seules quelques études empiriques ont tenté d'estimer à la fois les interactions écologiques intracouche et intercouche (par exemple [22,24]). Des études plus empiriques sont nécessaires pour paramétrer les bords intercalaires comme les effets cumulatifs des parcelles d'habitat permanentes, comparées à celles des parcelles éphémères, sur la dynamique des réseaux écologiques.

7. La dynamique des réseaux écologiques : un cadre fédérateur

La topologie d'un réseau d'interactions contraint les réponses écologiques de ses espèces et cela change à son tour la topologie et la fonction du réseau [6,28]. Les propriétés du réseau peuvent donc être utilisées pour générer et tester des hypothèses sur les processus sous-jacents qui façonnent les réseaux d'interaction [10,47]. Par exemple, Croft et al. [47] ont testé les comportements sociaux (par exemple, le toilettage, les agressions des liens dans le réseau) entre les individus (les nœuds) en utilisant des procédures de randomisation restreinte [10,53,54] pour tenir compte de la non-indépendance de ces interactions comportementales.

De même, les réseaux spatiaux tels que les réseaux de ruisseaux dendritiques peuvent imposer des contraintes de direction et de débit aux systèmes écologiques qui canalisent littéralement la dynamique potentielle des processus écologiques et des interactions entre espèces [32]. Benda et al. [66] ont formalisé ces contraintes de réseau comme « l'hypothèse de la dynamique du réseau » où un réseau de canaux et leurs confluences peuvent affecter à la fois les caractéristiques physiques et riveraines des réseaux dendritiques ainsi que l'amplitude et la stochasticité des perturbations dans ces réseaux de cours d'eau. Cette hypothèse de la dynamique du réseau spécifie les prédictions clés sur les effets directs de la topologie dendritique, ainsi que l'influence des terres environnantes (par exemple, la taille du bassin versant, l'altitude) sur le nombre de ruissellement, le volume d'eau, le débit et la qualité. Les effets des contraintes du réseau dendritique sur les espèces et la structure de la communauté ont été reconnus dans plusieurs études empiriques et de modélisation (par exemple [67-70], entre autres).

De même, les propriétés clés des réseaux spatiaux de parcelles d'habitat (par exemple, le nombre et le poids des nœuds et des liens) sont connues pour contraindre les propriétés et la dynamique des réseaux d'interaction des espèces [28]. Par exemple, le gravier et al. [71] ont développé un modèle conceptuel des interactions trophiques (par exemple prédateur-proie) dans le contexte de la théorie de la biogéographie insulaire. Ensuite, Guzman et al. [13] ont conceptualisé comment les capacités de dispersion des espèces - qu'ils ont appelées « propriétés d'utilisation spatiale » - les interactions entre les espèces.

La topologie d'un réseau spatial et ses changements contraignent les caractéristiques et la dynamique des réseaux d'interaction d'espèces qui y sont intégrés.

Les traits des espèces et les forces de leurs interactions écologiques limitent la façon dont les espèces réagissent aux changements du réseau spatial.

Les réseaux d'interaction peuvent affecter directement ou indirectement la structure et la dynamique du réseau spatial dans lequel ils se produisent.

Figure 2. Cadre de la dynamique des réseaux écologiques : une représentation schématique montrant que la topologie des réseaux spatiaux contraint la topologie et les fonctions des réseaux écologiques qui à leur tour peuvent modifier la topologie et les fonctions du réseau spatial.

L'ENDF souligne l'importance de l'interaction entre les réseaux d'interaction des espèces (par exemple, les réseaux trophiques) et les réseaux spatiaux (réseau de parcelles d'habitat), prenant explicitement en compte les contraintes topologiques, dynamiques et directionnelles (par exemple, la directionnalité temporelle, les contraintes d'aménagement spatial). Ainsi, les contraintes d'un réseau résultant des caractéristiques des espèces (ex. capacité de dispersion, niveau trophique) et la force de leurs interactions limitent la façon dont les espèces peuvent répondre aux changements du réseau spatial (nombre de taches, leur taille, qualité, disposition spatiale matériel électronique supplémentaire, figure S2).

L'ENDF peut aider à élucider les combinaisons de propriétés de réseau qui maintiennent un équilibre entre les effets positifs (par exemple, les effets de sauvetage par la dispersion et le flux de gènes) et les effets négatifs (par exemple, le risque accru d'invasion d'espèces, de prédation et de propagation des perturbations) dans les paysages dynamiques. En tant que tel, une série de combinaisons de propriétés de réseau (par exemple, le degré des nœuds ou la fugacité des nœuds et des liens) peut compenser les handicaps des nœuds ou des liens (par exemple, plus de nœuds de moindre qualité ou plus de liens de moindre résistance, du matériel électronique supplémentaire, figure S2) pour maintenir les espèces et leurs interactions [72,73]. Plus précisément, le rapport nœuds/liens et les effets de rétroaction dans ces systèmes en évolution doivent être pris en compte au niveau de l'élément (nœud et lien), du sous-réseau et du réseau. Par exemple, les modifications apportées aux parcelles d'habitat (quantité, matériel électronique supplémentaire de qualité, figure S2) affectent directement la richesse et l'abondance des espèces, ce qui à son tour affecte le nombre d'interactions entre les espèces [72] et peut éventuellement recâbler les interactions, entraînant des effets drastiques sur les espèces assemblages tels que les effets de cascade trophique spatiale [74].

Au niveau du réseau dans les réseaux d'interaction. Les contraintes des interactions entre les espèces et les topologies des niveaux trophiques détermineront le potentiel des espèces à recâbler leurs interactions dans des conditions environnementales changeantes, de sorte que l'appartenance aux nœuds qui forment des modules change au cours d'une saison.

Les espèces généralistes sont susceptibles de pouvoir reconnecter la topologie de leur réseau trophique en cas de changement environnemental.

Au niveau du réseau dans les réseaux spatiaux. L'interaction entre le rythme de changement du paysage et les caractéristiques des espèces (capacité de dispersion, taux de dispersion, temps de génération) déterminera les conditions (combinaisons de topologies de réseaux spatiaux) dans lesquelles les espèces persisteront ainsi que leurs interactions.

Les réseaux spatiaux de patchs connectés favorisent la dispersion des espèces mais aussi la propagation des prédateurs, des espèces envahissantes, des maladies et des perturbations.

La dynamique spatio-temporelle des taches (changements de qualité et de quantité) qui se produisent plus rapidement que la durée de vie des espèces entravera les capacités de dispersion des espèces, leur survie et leur persistance locale.

Au niveau du lien pour les caractères des espèces. Les contraintes des traits des espèces (capacité de dispersion, stratégie de reproduction, longévité) détermineront leur réponse aux topologies de réseaux dynamiques (même nombre de nœuds et de liens mais avec des poids différents de matériel électronique supplémentaire, figure S2).

Les espèces dispersées sur de courtes distances et les espèces à faible taux de dispersion persisteront si elles peuvent atteindre des parcelles de tremplin spatio-temporelles.

Ces exemples soulignent l'importance de déterminer comment le changement dans l'hétérogénéité du paysage perturbe les réseaux d'interaction en tenant compte des contraintes sur les capacités de dispersion des espèces et les interactions entre les espèces. Dans certaines circonstances, les réseaux d'interaction peuvent influencer directement ou indirectement la structure ou la topologie des réseaux spatiaux. Par exemple, les insectes disparus pourraient empêcher les événements de pollinisation, ce qui pourrait nuire à d'autres espèces de fondation [75], réduisant ou éliminant ainsi certaines des taches de végétation qui composent le réseau spatial. Pourtant, compte tenu du changement climatique, les espèces fondatrices peuvent influencer la topologie de leurs réseaux spatiaux par leur capacité à se disperser au sein de leur enveloppe climatique et à coloniser de nouvelles zones auparavant inaccessibles.

Ensuite, lorsque les systèmes écologiques qui ne sont apparemment pas contraints par les topologies des réseaux changent, cela indiquerait que les nouvelles réponses sont dues aux changements opérant à des niveaux au-delà des réseaux eux-mêmes. Ces connaissances sont essentielles pour comprendre la réponse des processus écologiques à un monde en mutation.

8. Prochaines étapes

L'écologie en réseau permet aux écologistes d'analyser et de modéliser la dynamique spatiale complexe des interactions entre les espèces à travers les échelles, les niveaux trophiques et les fonctions écosystémiques. Les outils d'analyse du réseau sont puissants et bien adaptés pour étudier les champs d'investigation écologiques sur la persistance des espèces dans les paysages dynamiques. Plus précisément, nous avons souligné ici l'importance de l'interaction entre la topologie du réseau spatial (patchs pondérés, liens pondérés, patchs de tremplin transitoires) et les traits des espèces (capacité de dispersion, temps de génération, recâblage) car ils sont essentiels pour déterminer les compromis sous lesquels les espèces persisteront dans des réseaux écologiques fonctionnels. Ainsi, des études écologiques (expérimentation sur le terrain, en laboratoire, ou analytiquement) peuvent être conçues pour déterminer les arbitrages (matériel électronique supplémentaire, figure S2) entre les effets synergiques de la dynamique de propriétés topologiques et fonctionnelles du réseau et les processus écologiques dynamiques qui évoluent sur et dans ces réseaux. Par exemple, l'ENDF lui-même peut être évalué en traçant les dépendances dans les réseaux multicouches dans le temps en codant les contraintes à l'aide de la matrice de supra-adjacence appropriée.

(a) Délimiter des réseaux écologiques spatiaux fonctionnels

Les perturbations naturelles et anthropiques combinées au changement climatique limiteront la quantité d'habitat disponible pour la persistance des espèces en diminuant la taille et la qualité des parcelles et en rendant le paysage entre les parcelles plus inhospitalier. Certaines espèces peuvent compenser ces effets, jusqu'à un certain point, par la combinaison de leurs capacités ou taux de dispersion, de leur longévité et de leurs interactions avec d'autres espèces. Ensuite, étant donné les divers degrés d'hétérogénéité spatiale du paysage, les réseaux d'interaction et les réseaux trophiques peuvent varier dans leurs topologies. Il est donc important de délimiter où se trouvent les parcelles d'habitat, ainsi que où les propriétés d'un réseau trophique s'arrêtent dans l'espace. Ici, nous suggérons de délimiter des «réseaux écologiques spatiaux fonctionnels» dans des modules d'interaction d'espèces basés dans l'espace et des réseaux de parcelles d'habitat [13,76,77]. Plusieurs méthodes sont disponibles pour identifier les réseaux d'interaction (espèces en tant que nœuds) [4], y compris les graphlets (généralement des triades ou des quatuors de nœuds [3,4,54,55]). Les types d'interactions d'espèces peuvent être calibrés par des filtres utilisant des graphlets comme modèles (figure 3une) ceux-ci peuvent être mis à l'échelle en fonction des domaines de dispersion des espèces (domaines vitaux principaux par rapport aux domaines vitaux étendus, figure 3b), de manière similaire à l'évaluation des réponses des scores d'appariement élevés et faibles en fonction de l'échelle et de la position dans l'analyse par ondelettes [49].

Figure 3. Exemple de la façon de délimiter des réseaux écologiques spatiaux fonctionnels en mettant à l'échelle les réseaux d'interaction spatiale (avec des espèces comme nœuds) qui se produisent dans des réseaux spatiaux (avec des parcelles comme nœuds) en utilisant les capacités de dispersion des espèces. (une) Tout d'abord, des modèles de graphlets sont utilisés pour caractériser les réseaux d'interaction des espèces (panneau de gauche), puis un algorithme de détection de contour est utilisé pour délimiter les réseaux spatiaux. Ici, l'algorithme de triangulation-wombling détecte les limites en déterminant les taux de changement parmi les triplets d'échantillons indiqués par des lignes en pointillés. De faibles taux de changement parmi les triplets indiquent une homogénéité (c'est-à-dire des échantillons intra-patch), tandis que des taux de changement élevés suggèrent une limite. (b) Ces deux approches sont combinées pour comparer et intégrer les échelles des deux types de réseaux. Les modèles de graphlet sont mis à l'échelle en fonction des capacités de dispersion des espèces à la fois des prédateurs (ici trois prédateurs indiqués par trois couleurs) et des espèces de proies (ici trois espèces indiquées par trois couleurs). Le domaine vital du prédateur est échelonné en fonction de la saison et de la disponibilité de la nourriture. Les zones centrales des domaines vitaux sont indiquées par des lignes pointillées tandis que les domaines vitaux étendus sont indiqués par des lignes continues. Ensuite, la détection des bords (c'est-à-dire le modèle triangulaire) est également mise à l'échelle pour délimiter les parcelles d'habitat spatial. L'intégration des deux types de gabarits (graphlets et triangles spatiaux) permet de délimiter des réseaux écologiques spatiaux fonctionnels à plusieurs échelles. Les réseaux écologiques spatiaux fonctionnels détectés correspondent à l'épine dorsale des interactions entre les espèces, celles-ci persistent dans tout le paysage bien que les identités des espèces puissent changer (comme indiqué par le codage couleur des prédateurs et des proies). Ces réseaux écologiques spatiaux fonctionnels d'espèces potentiellement différentes en interaction forment un métaréseau, comme le montre le panneau inférieur. (Version en ligne en couleur.)

De la même manière, un réseau spatial de parcelles d'habitat peut être délimité à l'aide d'un algorithme de détection de bordure (figure 3une) [49] qui est également sensible à l'échelle, basé sur un modèle évolutif utilisant des triplets d'emplacements d'échantillonnage (figure 3b). Pour une échelle et une position données, l'uniformité parmi les échantillons du triplet indique qu'il se trouve dans un patch à cette échelle et à cet emplacement, de grandes différences entre les valeurs indiquent un bord.

La combinaison des réseaux d'interaction et des réseaux spatiaux peut aider à déterminer les conditions dans lesquelles les fonctions du réseau d'interaction (ou les traits d'espèce) persistent lorsque le renouvellement des espèces ou le recâblage du réseau se produit le long de gradients spatiaux (figure 3b). En utilisant des modèles évolutifs basés sur les capacités de dispersion des espèces, des métaréseaux de réseaux écologiques spatiaux fonctionnels peuvent être identifiés. Ensuite, les propriétés de stabilité et de connectivité de ces réseaux écologiques spatiaux à travers l'espace peuvent être évaluées. Cela peut être fait en examinant les changements dans les valeurs propres des matrices jacobiennes pour les interactions d'espèces, ou dans les valeurs propres des matrices d'adjacence pour la connectivité des patchs [1,78,79]. L'alignement entre les modules du réseau d'interaction, basé sur la redondance d'un ensemble de graphlets parmi les interactions d'espèces, et les parcelles du réseau spatial peut être utilisé pour déterminer l'épine dorsale du réseau écologique spatial fonctionnel [80,81].

(b) Aller de l'avant

Les applications potentielles des réseaux en écologie, et en particulier des réseaux multicouches, semblent illimitées dans leur capacité à représenter, modéliser et tester les relations et interactions spatiales et temporelles entre les unités écologiques des individus aux communautés. Cependant, nous devons faire attention à ne pas inclure trop de couches dans un réseau multicouche car la force de l'approche réseau est la simplification de la complexité écologique. Un intérêt particulier peut être la capacité des réseaux spatio-temporels à évaluer et analyser les vitesses des processus écologiques de changement, et la longévité, le temps de réaction et la capacité de la « mémoire écologique » dans les systèmes étudiés. Par conséquent, des connaissances spécifiques sur les changements dans les réponses temporelles des espèces au sein de la topologie du réseau spatial devraient être acquises. Ensuite, le recâblage et le renouvellement des espèces doivent être évalués tout en tenant compte des rapports entre les temps de génération des espèces et la dynamique du paysage.

Le prochain programme de recherche du domaine de l'écologie des réseaux devrait donc être d'évaluer comment les effets spatiaux locaux (tels que les fonctions de contingence ou de désintégration) se comparent aux effets dans l'ensemble du réseau (ou son épine dorsale) ainsi qu'avec l'héritage des effets temporels, qui peut être permanent, transitoire ou fluctuant.


2. MATÉRIELS ET MÉTHODES

Le code écrit dans r 3.6.3 (R Core Team, 2018 ) pour les deux exemples simulés est disponible dans Supporting Information. Nous avons choisi deux exemples de simulations, chacune illustrant l'effet d'un facteur de confusion différent. La première simulation capture le biais d'observation et la seconde capture la préférence sociale ainsi que la préférence de localisation. Notre cadre de simulation s'inspire de ceux de Farine ( 2017 ), Farine et Whitehead ( 2015 ) et Whitehead et James ( 2015 ). Nous démontrons également la méthode à l'aide d'un exemple concret, avec des données sociales sur les raies manta de récif. Mobula alfredi de Perryman et al. (2019).

2.1 Simulation 1 : Différences entre les sexes dans la grégarité et la visibilité

Nous avons conçu notre premier modèle pour simuler un scénario dans lequel une étude teste une différence de sexe dans la grégarité – une analyse nodale.Nous avons simulé une population de 100 individus, avec un sex-ratio égal, dans laquelle les femelles étaient plus grégaires que les mâles, mais les mâles étaient plus faciles à observer. Tous les individus ont reçu un niveau de grégarité g à partir d'une distribution normale tronquée (bornes 0 et 1) avec une moyenne de gF pour les femmes et gM pour les hommes, et un écart type de 0,1. Les individus ont également reçu une fréquence d'observation s de la même distribution mais avec une moyenne SF pour les femmes et SM Pour les hommes. Les femelles sont supposées être plus grégaires et se sont donc vu attribuer une plus grande grégarité que les hommes. On a également supposé que les femelles étaient plus difficiles à observer que les mâles (peut-être en raison de leur visibilité, de leur taille ou de leur comportement) et se sont donc vu attribuer une probabilité d'observation plus faible que les mâles. Nous avons systématiquement varié les valeurs de gF, SF et SM.

En utilisant le graphique fonction dans le package r sna (Butts, 2016 ), nous avons ensuite simulé t = 100 périodes d'échantillonnage. À chaque période d'échantillonnage, chaque individu a toujours été observé de sorte que nous disposions d'un cas de référence d'échantillonnage parfait pour chaque passage. La probabilité que deux individus observés soient observés en train de s'associer était égale au produit de leurs scores de grégarité. Une fois l'échantillonnage terminé, nous avons généré le réseau d'associations en utilisant l'indice de ratio simple (SRI) (Cairns & Schwager, 1987) et mesuré la somme de la force des connexions (degré pondéré) pour chaque individu comme mesure de leur grégarité observée. Pour chaque passage, nous avons ensuite simulé un échantillonnage sur le réseau, où chaque individu a été observé avec probabilité SM pour les hommes et SF pour les femelles. Pour ce faire, nous supprimons toutes les associations impliquant des individus qui n'ont pas été observés au cours d'une période d'échantillonnage donnée.

Dans les deux modèles, nous avons autorisé une variance inégale selon le sexe. Le sexe a également été inclus en tant qu'interaction avec le nombre d'observations centré sur la moyenne. Cela a amélioré l'ajustement du modèle en raison d'une interaction entre la grégarité et les observations : parce que nous savons que les sexes diffèrent dans leur grégarité, nous nous attendrions également à ce qu'ils aient des relations différentes entre la fréquence et la force des observations. Pour une comparaison équitable entre les paramétrisations du modèle, le modèle compare ensuite l'effet du sexe au niveau moyen de fréquence d'observation, et nous prenons le rapport comme taille d'effet. Nous avons trouvé qu'une relation linéaire avec le nombre d'observations était un bon ajustement pour ce modèle.

Nous avons utilisé une procédure de permutation pour déterminer la signification statistique des coefficients de régression pour le modèle nodal corrigé. Bien que notre étude porte sur les tailles d'effet, notre intention est de démontrer leur utilisation ainsi que les permutations. Des travaux récents ont mis en évidence des problèmes liés à l'utilisation de permutations de flux de données avec une régression standard pour tester des hypothèses telles que celle qui nous intéresse ici (Weiss et al., 2020). Ainsi, nous utilisons plutôt la méthode du double semi-partiel décrite par (Dekker, Krackhardt, & Snijders, 2007 ) avec 10 000 permutations des résidus, en utilisant les statistiques pivots (t pour le quasi-poisson, z pour la version bêta) comme statistiques de test. Cette procédure de permutation ne tient pas compte de l'échantillonnage ou d'autres effets de confusion, mais ce n'est pas nécessaire, car nous les avons déjà contrôlés dans notre modèle statistique.

2.2 Simulation 2 : Assortiment de sexe et préférences de localisation

Nous avons conçu la deuxième simulation pour tester l'hypothèse selon laquelle les individus du sexe opposé ont des préférences sociales plus fortes les uns pour les autres que pour les individus du même sexe. Cependant, nous avons également inclus une différence de sexe dans la préférence de localisation, qui a confondu les véritables préférences sociales des individus - une analyse dyadique. Nous avons simulé 100 individus, dont la moitié étaient des femmes et la moitié des hommes. Pour toutes les dyades du même sexe, nous avons attribué une préférence d'association à partir d'une distribution normale tronquée avec une moyenne SMême = 0,25 et écart type de 0,1 (bornes 0 et 1). Nous avons fait de même pour toutes les paires d'individus de sexe différent, mais en utilisant une moyenne de SDifférent = 0,5. Cette matrice d'association a été supposée symétrique. Nous avons supposé deux emplacements d'échantillonnage A et B et attribué une préférence pour l'emplacement B à chaque individu, en utilisant une distribution normale tronquée avec un écart type de 0,1 et des moyennes de LM = 0,8 pour les hommes (forte préférence pour l'emplacement B) et LF = 0,2 pour les femmes. Pour examiner la taille de l'effet sans biais dans les préférences de localisation, nous avons également exécuté la simulation avec une préférence moyenne de LM = LF = 0,5 pour l'emplacement B (c'est-à-dire sans préférence) pour les deux sexes pour chaque ensemble de valeurs de paramètre pour Smême et Sdifférent.

Nous avons ensuite simulé t = 100 périodes d'échantillonnage comme précédemment. À chaque période d'échantillonnage, nous avons attribué à chaque individu un emplacement (A ou B) en fonction de sa préférence d'emplacement. Les individus ne pouvaient alors s'associer que s'ils se trouvaient au même endroit à ce moment-là, et la probabilité que deux individus observés soient observés en train de s'associer était proportionnelle au produit de leurs préférences d'association. Dans chaque recensement par sondage, nous avons noté si chaque paire d'individus était observée en train de s'associer.

Nous avons utilisé la procédure d'attribution quadratique de régression multiple (MRQAP) pour calculer la signification de ce modèle corrigé. Il y a des mises en garde avec cette approche. Premièrement, le GLMQAP traite spécifiquement de la non-indépendance entre les arêtes qui survient parce qu'elles sont connectées au même nœud, mais cela est déjà complètement traité par l'effet aléatoire de multi-appartenance. En tant que tel, il n'est pas nécessaire d'utiliser des permutations avec cette approche. De plus, MCMCglmm est une approche bayésienne, et donc p les valeurs ne sont pas un aspect standard de l'analyse. Cependant, nous avons inclus la procédure de permutation ici pour démontrer une approche de permutation appropriée, si cela est souhaité. Le MRQAP utilise la méthode de la double permutation semi-partielle (Dekker et al., 2007 ) avec 10 000 permutations. Cette méthode est équivalente à la procédure d'affectation quadratique de régression multiple (MRQAP), mais en ajustant les GLM au lieu de la régression des moindres carrés. Cette procédure GLMQAP est disponible dans le package aninet r, accessible via GitHub (https://github.com/MNWeiss/aninet).

2.3 Données sur les raies manta des récifs : différences entre les sexes dans la grégarité

La simulation est la meilleure approche pour tester notre méthode car elle nous permet de savoir quelle devrait être la taille de l'effet. Cependant, nous démontrons également la méthode sur des données complexes. En tant que tel, nous avons utilisé des données d'association basées sur des groupes sur les raies manta de récif (pour plus de détails, voir Perryman et al., 2019 ). Des raies manta de récif individuelles ont été identifiées par des méthodes standard de photo-identification, et des données sur la composition des groupes ont été collectées de novembre 2013 à mai 2018 dans la région du détroit de Dampier à Raja Ampat, en Papouasie occidentale, par des chercheurs qualifiés plongeant à l'aide d'un équipement de plongée sous-marine ou en apnée, selon sur la position des rayons dans la colonne d'eau. En accord avec Perryman et al. ( 2019 ), nous avons retiré les individus observés moins de 10 fois pour améliorer la fiabilité des données (Whitehead, 2008) et dérivé le SRI en utilisant une période d'échantillonnage de 15 jours. Dans l'ensemble de données résultant, il y a 70 femmes uniques, 42 hommes uniques, 1 257 observations de femmes, 643 observations d'hommes, 17,96 observations moyennes par femme et 15,31 observations moyennes par homme. En tant que tel, il existe un cas clair de plus de femelles ou de suréchantillonnage de femelles.


Deux types de dynamiques : topologie et flux

Notre concept de réseau, et ce qu'il représente, dépend de deux types de dynamiques clés : les processus de flux sur le réseau et les changements dans la topologie sous-jacente du réseau. La dynamique des flux est la façon dont les ressources, les contacts, les informations, les maladies, etc. sont propagés entre les sommets du réseau, pour un ensemble donné de sommets et d'arêtes. La dynamique topologique est la façon dont la structure du réseau change en raison de la variation de l'identité ou du poids des bords (parfois appelée « câblage »). Les systèmes peuvent présenter un ou les deux types de dynamique, et les questions d'intérêt détermineront l'orientation appropriée. Par exemple, les changements évolutifs et saisonniers dans les interactions entre plusieurs espèces dans un réseau de pollinisation ( Bascompte & Jordano 2007 Petanidou et al. 2008 ) sont des dynamiques topologiques. Alternativement, les échanges de ressources entre les plantes et les animaux (par exemple la biomasse dans un réseau trophique ( Jarre-Teichmann & Pauly 1993 ) ou la maladie dans une population ( Rothenberg et al. 1998 )) représenterait la dynamique des flux.

Les échelles de temps relatives des processus sous-jacents peuvent être importantes pour comprendre à la fois la dynamique topologique et celle des flux. La topologie peut influencer le flux, et le flux peut également influencer la topologie. Si les deux se produisent sur une échelle de temps similaire, des rétroactions entre les deux peuvent exister. Dans l'exemple de la transmission de la maladie sur un réseau social, contracter la maladie (le résultat de processus de flux) peut entraîner des changements dans les interactions avec les autres ( Croft et al. 2011a ), soit par des changements dans le comportement de l'individu malade, soit par des changements dans la réponse des autres à cet individu et donc à la topologie du réseau ( Fefferman & Ng 2007 Bansal et al. 2010 Romano et al. 2010). Les réseaux qui présentent un couplage et une forte rétroaction entre les deux échelles de temps sont parfois considérés comme « adaptatifs » ou « co-évolutifs » (Gross & Blasius 2008).


Matériaux et méthodes

Nous avons construit des réseaux bipartites non dirigés et non pondérés enregistrant les liens entre les acteurs et les films (« collaboration d'acteurs »), les auteurs d'articles scientifiques et les revues dans lesquelles ils ont publié (« paternité »), les législateurs votent sur les lois (« législature »), les organismes et les parties du corps où ils se trouvent (« microbiome »), et les quartiers de la ville et les événements criminels (« crimes »). Ces systèmes ont été choisis en fonction de deux caractéristiques : (1) pour chaque catégorie, plusieurs réseaux (100 ou plus) pourraient être construits en utilisant la même méthodologie et (2) les réseaux au sein de chaque catégorie afficheraient une large gamme de tailles et de niveaux de connectivité. .

Nous avons également constitué une grande base de données de plus de 500 réseaux écologiques bipartites, représentant soit antagonistes (hôte–parasite, hôte–parasitoïde, bactérie–phage, plante–herbivore) soit mutualistes (plante–pollinisateur, plante–graine disperseur, fourmi–plante, interactions anémone-poisson).

Les statistiques récapitulatives sur la taille et la connectivité pour chaque classe de réseaux sont rapportées dans le tableau 1, les détails de la façon dont les réseaux ont été construits et les références pour les réseaux publiés sont fournies dans les informations complémentaires.


Quels sont quelques exemples de réseaux pondérés non orientés en écologie ? - La biologie

Revue internationale des communications, des réseaux et des sciences des systèmes Vol.10 No.10(2017), Numéro d'article : 79544,14 pages
10.4236/ijcns.2017.1010012

La structure hiérarchique dans les réseaux signés dirigés et non dirigés

Jamal Maktoubian 1*# , Mohebollah Noori 2 , Mahta Amini 3 , Mehran Ghasempour-Mouziraji 4

1 École internationale de gestion de l'information (ISIM), Université de Mysore, Mysore, Inde

2 Branche de Zarghan, Université islamique Azad, Zarghan, Iran

3 Département d'informatique, Université Shahid Beheshti, Téhéran, Iran

4 Département d'ingénierie, Université islamique Azad de Sari, Sari, Iran

Copyright © 2017 par les auteurs et Scientific Research Publishing Inc.

Ce travail est sous licence Creative Commons Attribution International License (CC BY 4.0).

Reçu : 30 août 2017 Accepté : 8 octobre 2017 Publié : 11 octobre 2017

Le concept de stratification sociale et de hiérarchie entre les dates humaines remonte à l'origine de la race humaine. À l'heure actuelle, la notoriété croissante des réseaux sociaux nous a donné l'occasion d'analyser ces phénomènes bien étudiés sur différents réseaux à différentes échelles. Généralement, un réseau social peut être défini comme un ensemble d'acteurs et de leurs interactions. Dans ce travail, nous nous intéressons à un type particulier de réseaux sociaux, appelés réseaux de confiance. Dans ce type de réseaux, il y a une démonstration explicite de confiance (interaction positive) ou de méfiance (interaction négative) entre les acteurs. Dans un réseau social, les acteurs ont tendance à se connecter les uns aux autres sur la base de leur hiérarchie sociale perçue. L'émergence d'une telle hiérarchie au sein d'une communauté sociale montre la manière dont l'autorité se manifeste dans la communauté. Dans le cas des réseaux signés, le concept de hiérarchie sociale peut être interprété comme l'émergence d'une structure arborescente comprenant des acteurs de haut en bas dans l'ordre de leurs rangs, décrivant une relation parent-enfant spécifique, à savoir. l'enfant fait confiance au parent. Cependant, en raison de la présence d'interactions positives et négatives dans les réseaux signés, la dérivation de telles « hiérarchies de confiance » est un défi non trivial. Nous soutenons que les notions traditionnelles (de réseaux non signés) sont insuffisantes pour dériver des hiérarchies latentes au sein de réseaux signés.

Réseau non signé, Réseau signé, Central Reaching Centrality (GRC), Hiérarchie, Réseau social

L'analyse structurelle de réseaux complexes a été un domaine d'intérêt dynamique et stimulant pour les chercheurs au cours des dernières décennies [1] . Au sens générique, un réseau est un ensemble de nœuds associés les uns aux autres par des liens [2] . Plusieurs approches de la théorie des graphes sur de tels réseaux ont révélé certains faits fondamentaux. De toute évidence, l'analyse de réseau pourrait nous fournir de meilleures informations pour comprendre les aspects cachés des individus ou des groupes impliqués au sein d'un réseau, le modèle des relations, leur évolution, etc. [3] . Tout réseau pourrait être représenté comme un graphe composé d'une collection de nœuds (unités) et d'arêtes (interactions) [4] . Dans un réseau, la manière dont un nœud interagit avec l'autre présente une caractéristique importante, la connectivité entre les nœuds. La nature de la connectivité sous-jacente à un réseau détermine également sa topologie complexe. En d'autres termes, la complexité du réseau est une propriété intrinsèque de tout système physique, chimique, biologique ou social caractérisé par divers nœuds et leurs interactions [5] . Les exemples incluent les réseaux organisationnels, les réseaux de neurones, les réseaux d'interaction de protéines, Internet, le World Wide Web et les réseaux sociaux pour n'en citer que quelques-uns.

La dernière décennie a vu une énorme augmentation de la popularité des réseaux sociaux en ligne tels que Twitter, Digg, Youtube, Delicious, Livejournal, Facebook etc. Notre étude se concentre principalement sur les analyses de réseaux sociaux en ligne similaires afin de comprendre le mécanisme sous-jacent de la connexions impliquées ainsi que de vérifier l'existence de certains phénomènes sociaux au sein des réseaux. D'une manière générale, un réseau social peut être dirigé ou non selon le type d'arêtes qu'il contient. Les réseaux sociaux dirigés se distinguent des réseaux non dirigés par la présence de contours dirigés entre les acteurs [6] . Un exemple (Figure 1) de réseau dirigé pourrait être le nombre de followers sur Twitter où un acteur en « suit » simplement un autre. Alternativement, les réseaux sociaux non dirigés comprennent des bords non dirigés entre les acteurs. Facebook est un exemple de réseaux non dirigés dont les contours ne représentent que des amitiés mutuelles.

Un autre type de classification appelé réseaux de confiance traite de la nature des interactions (positives ou négatives) impliquées dans les réseaux sociaux. Dans ce type de classification, un réseau social pourrait être classé comme signé ou non signé. Les réseaux non signés sont décrits par la présence d'un seul type d'interaction, généralement de nature positive. C'est-à-dire que dans les réseaux non signés, tous les acteurs sont les mêmes, qu'ils soient amis ou étrangers. En règle générale, les réseaux sociaux s'avèrent en grande partie de nature non signée [7] . Suivi sur Twitter et amitié sur Facebook

Figure 1 . Exemples de connectivité réseau dirigée et non dirigée.

sont des exemples typiques. Mais dans le monde réel, les relations ne doivent pas toujours être de nature positive. Les réseaux signés captent cet aspect de la société permettant une démonstration explicite de confiance ou de méfiance entre les acteurs. Ils peuvent désigner les autres comme amis ou ennemis [8] . Dans ce scénario, on dit qu'un acteur fait confiance à l'autre si un acteur approuve son opinion entre eux. Dans le même temps, on dit qu'un acteur se méfie de l'autre si un acteur désapprouve son opinion. E-opinions, le réseau Slashdot Zoo sont quelques-uns des exemples de réseaux signés qui indiquent explicitement confiance/amis ou méfiance/ennemis entre eux en utilisant un poids de bord de +1 et -1 respectivement. Mathématiquement, un réseau signé peut être défini comme un graphe orienté, G = (V, E) où i) V est l'ensemble des acteurs d'un réseau, E Í V × V est l'ensemble des arêtes telles que (u, v) indique un lien entre u Î V et v Î V s : E → <+1, −1>assigne le poids de l'arête [9] . Considérez l'illustration suivante de la Figure 2. Si le nœud A est connecté au nœud B en tant qu'ami, il doit y avoir un bord dirigé du nœud A vers le nœud B avec un score de confiance de +1. Pendant ce temps, si A est connecté à B en tant qu'ennemi, il devrait y avoir un avantage dirigé de A vers B avec un score de -1.

2. Contexte et travaux antérieurs

Divers aspects de la hiérarchie ont été étudiés dans de nombreuses littératures jusqu'à ce jour. L'idée générale derrière le concept de hiérarchie peut être énoncée comme l'émergence d'une structure arborescente de haut en bas dans l'ordre de leurs rangs décrivant davantage une relation spécifique. Des études antérieures sur les relations de dominance dans les sociétés animales, Bonabeau et al. suggèrent un processus d'auto-organisation des nœuds en fonction de leurs rôles et de leur importance [10] . Cela conduit à l'identification de nœuds importants ou « leaders » au sein d'une communauté. De tels nœuds occupent les positions les plus élevées dans la hiérarchie. Par conséquent, on peut affirmer que dans une hiérarchie, le nœud supérieur indique une plus grande influence que les nœuds inférieurs. En utilisant l'analyse de la fonction de corrélation directionnelle, M. Nagy et al. ont constaté que des hiérarchies de dominance similaires existent dans le cas des troupeaux de pigeons [11] .

En 1984, Huseyn et al. [12] ont suggéré que la hiérarchie se retrouve dans de nombreux systèmes complexes. L'organisation hiérarchique est également étudiée dans différents réseaux réels tels que le réseau d'acteurs, le réseau linguistique, Internet et le World Wide Web par Ravasz et Barabási en 2003 [13] . Ils ont proposé que de nombreux réseaux réels sont sans échelle et de nature transitive, ce qui peut être considéré comme une conséquence de la hiérarchie sous-jacente au réseau. De petits groupes de nœuds se réorganisent pour former une hiérarchie de groupes plus importants. Afin d'examiner la présence d'une structure hiérarchique dans les réseaux réels, ils ont soutenu que la loi d'échelle pour le coefficient de clustering Ck est suffisante pour quantifier l'existence d'une hiérarchie de nœuds [14] .

Figure 2 . Exemples de connectivité réseau signée.

De même, la hiérarchie est également observée dans certains types de réseaux de collaboration. Rowe et al. [15] , ont proposé un nouvel algorithme pour trouver la hiérarchie sociale dans les réseaux de messagerie en introduisant un score social S. Ce score est calculé pour chaque utilisateur comme une combinaison pondérée de plusieurs autres mesures, y compris le nombre d'e-mails échangés. Plusieurs études ont proposé différentes mesures hiérarchiques qui manquaient d'applicabilité universelle sur tous les types de réseaux.Au lieu d'employer différentes mesures, le besoin d'une seule mesure efficace pour quantifier la hiérarchie dans les réseaux complexes était inévitable.

Liben-Nowell et E. Gilbert et al. [16] [17] Étudié sur les réseaux sociaux a traité de prédiction de lien et de prédiction de force de lien. Ils ont abordé la question de la prédiction de liens et discuté de certaines réalisations basées sur des mesures de proximité de nœuds dans un réseau. Plutôt que de considérer l'évolution du réseau, un instantané statique du réseau ainsi que certains attributs de nœuds spécifiques sont pris en compte. La prédiction de liens peut être appliquée à l'analyse des réseaux sociaux pour découvrir des interactions intéressantes ou prometteuses au sein de ses membres. En 2009, E. Gilbert et al. a fourni un modèle prédictif de la résistance des attaches. Le modèle distingue efficacement les liens forts et faibles avec une précision de plus de 85 %. Le modèle prédit la force d'attache en observant la manière dont un utilisateur choisit de communiquer avec un autre utilisateur en particulier quel que soit le nombre d'autres choix proposés.

En dehors de cela, des tentatives ont été faites dernièrement pour explorer également les hiérarchies. Helic D. et Strohmaier M. [18] se sont penchés sur l'utilité des hiérarchies de balises pour améliorer la navigabilité dans les sites de balisage social comme Delicious, CiteULike et Flickr. Cet article vise à explorer l'utilité des hiérarchies de balises en tant que répertoires pour faciliter la navigation ou la navigation dans les systèmes de balises sociales. Afin de construire une telle hiérarchie de balises, les auteurs ont proposé une nouvelle version d'un algorithme existant basé sur la centralité avec un facteur de branchement b comme paramètre d'entrée qui décrit le nombre maximum de catégories et sous-catégories. Il utilise la cooccurrence de balises comme mesure de similarité et la généralité de balises comme mesure de centralité sur les réseaux de balises. Dans un réseau de balises, chaque balise est considérée comme un nœud et est liée à l'autre nœud selon un certain seuil d'occurrence. Dans le processus de construction d'une hiérarchie, les nœuds sont d'abord classés par ordre décroissant en fonction du degré de centralité (seuil de généralité) pour obtenir une liste de centralité. En conséquence, les balises les plus générales sont placées au premier rang.

L'algorithme proposé a une procédure en deux phases pour s'assurer qu'autant de balises données sont connectées à l'arbre principal sans que l'arbre soit assez profond. Dans la première phase, il remplit une forêt de plusieurs arbres avec le nœud le plus général comme nœud racine, parcourt la liste de centralité, identifie la balise la plus similaire à la balise actuelle dans l'arbre en calculant le seuil de cooccurrence, puis ajoute le tag en tant qu'enfant à ses tags les plus similaires. Il rattache un maximum de sous-catégories à une catégorie donnée. Plus tard, les arbres produits sont triés par ordre décroissant de leur taille (nombre de catégories qu'ils possèdent) et le plus grand arbre est considéré comme l'arbre principal. Dans la deuxième phase, l'algorithme ajoute les autres arbres à l'arbre principal en connectant le nœud racine d'un arbre particulier au nœud le plus similaire dans l'arbre principal. Dans le cas où le mode le plus similaire consiste en un seul emplacement de sous-catégorie libre, une catégorie divers est alors introduite dans l'emplacement libre, puis l'arbre donné est ajouté à cette catégorie divers. Cependant, l'imbrication de catégories diverses est également nécessaire et ne peut être complètement évitée en raison de la structure même des réseaux tag-tag. Normalement, dans un réseau à loi de puissance typique, les nœuds à haut degré de centralité sont connectés à un petit nombre de nœuds de haut et moyen degrés (haute centralité) ainsi qu'à un grand nombre de nœuds de bas degré (faible centralité). Ces balises à haute centralité occupent les premières positions de la hiérarchie. Par conséquent, dans le processus de construction de la hiérarchie, l'algorithme ajoute d'abord les nœuds adjacents de degré élevé et moyen en tant que sous-catégories à un nœud donné en utilisant tous les emplacements libres de sous-catégorie, suivi de l'ajout des nœuds de faible degré via la catégorie divers. . Il est à noter que les catégories diverses imbriquées n'affectent pas la sémantique du réseau mais maintiennent plutôt les balises à l'écart des plus apparentées dans ses catégories diverses. Les résultats et les études de simulation illustrent que l'algorithme proposé surpasse ceux existants dans la construction d'une hiérarchie de balises utile pour une meilleure navigation.

Maiya et Berger-Wolf [19] ont introduit une méthode simple et flexible basée sur le maximum de vraisemblance pour déduire une hiérarchie sociale à partir de réseaux sociaux pondérés. Ils ont utilisé un algorithme glouton simple pour déduire une hiérarchie de vraisemblance maximale à partir d'un réseau donné. Cette approche a été évaluée par rapport à des ensembles de données simulées et réelles pour la précision. Cette méthode peut également être utilisée pour déduire les modèles d'interaction générative qui pourraient conduire à un réseau social. Les résultats montrent que les hiérarchies peuvent être déduites des associations entre les différentes entités d'un réseau, fournissent la fréquence et l'occurrence de ces associations.

Gupté et al. [20] ont étudié l'émergence de la hiérarchie dans les réseaux sociaux dirigés. Ils proposent une mesure de la hiérarchie et illustrent comment la hiérarchie et le degré de stratification émergent avec l'augmentation de la taille du réseau. L'article présente une mesure de la hiérarchie et un algorithme de temps polynomial pour trouver la plus grande hiérarchie dans les réseaux dirigés. Cet article montre également qu'avec l'augmentation de la taille du réseau, la taille de la hiérarchie augmente de manière significative, mais le taux de stratification a tendance à être lent. Les études reposent sur l'hypothèse qu'il existe un rang social global pour chaque personne d'un réseau et que chacune d'entre elles est consciente de ses rangs ainsi que des rangs des personnes auxquelles elle est liée. Il a été observé que lorsque des personnes de rangs supérieurs dans une hiérarchie relient (ou recommandent) des personnes de rangs inférieurs, il se produit une quantité considérable d'agonie sociale en fonction de la différence entre leurs rangs.

3. Centralité de portée mondiale (GRC)

En 2012, le problème a été examiné et une mesure de hiérarchie universelle a été récemment proposée par Mones et al. [21] . Connue sous le nom de Global Reaching Centrality (GRC), cette nouvelle mesure capture la distribution hétérogène des centralités de portée locale dans un réseau. Contrairement à d'autres mesures suggérées jusqu'à présent, GRC prétend surmonter de nombreux inconvénients et est largement applicable à toutes les classes de réseaux complexes. Ils proposent une mesure de hiérarchie universelle basée sur Global Reaching Centrality et une technique de visualisation pour tout type de réseau complexe du monde réel [22] . Dans un réseau, la complexité survient souvent en raison des interactions entre des unités similaires ou en raison de la nature des interactions (arêtes) et des unités (nœuds). La hiérarchie est une caractéristique impérative de tout réseau complexe. Cependant, l'émergence d'une hiérarchie au sein d'un réseau dépend largement de la mesure dans laquelle un nœud influence l'autre ainsi que le système dans son ensemble. Par conséquent, un nœud ayant la plus forte influence peut être considéré comme « central » pour un réseau. En d'autres termes, les nœuds avec un impact plus fort peuvent être à un ordre plus élevé (rang) dans une hiérarchie. En fait, la détermination de tels nœuds devient cruciale pour définir une mesure de hiérarchie. En dehors d'un réseau arborescent, un réseau réel est beaucoup plus compliqué avec l'existence de relations entre des nœuds de même niveau, des cycles de nœuds connectés, des clusters, des arêtes se déplaçant vers le haut, etc. Par conséquent, la détection de la hiérarchie dans les réseaux est très exigeante. Les mesures hiérarchiques suggérées jusqu'à présent ne peuvent pas être appliquées à différents systèmes complexes en raison de nombreuses lacunes. Afin de définir une mesure basée sur l'atteinte des centralités, l'article se concentre essentiellement sur les hiérarchies de flux dans les réseaux hiérarchiques (AH) réels et ajustables.

Le concept de Global Reaching Centrality (GRC) [21] mesure la distribution hétérogène des centralités de portée locale dans un graphe. La centralité de portée locale est largement basée sur un cas généralisé de centralité de portée m avec m = N où N est le nombre de nœuds dans un graphe donné. Dans un graphe orienté non pondéré, la centralité d'atteinte locale est le rapport du nombre de nœuds avec une distance dirigée positive finie d'un nœud particulier au nombre maximum de nœuds atteignables à partir du même nœud. Par conséquent, le GRC d'un graphe orienté non pondéré peut être défini comme la différence entre les centralités locales les plus élevées et moyennes au sein d'un réseau, donnée par [21] :

GRC = ∑ i ∈ V [ C R max − C R ( i ) ] N − 1 (1)

V = ensemble de nœuds C R ( i ) = centralité d'atteinte locale C R max = centralité d'atteinte locale la plus élevée N − 1 = traversées maximales possibles.

Pour les graphes non orientés pondérés, la généralisation de GRC est assez simple basée sur la centralité d'atteinte locale telle que définie pour les graphes directs non pondérés. Dans le cas des graphes orientés pondérés, la somme des longueurs de tous les chemins dirigés sortants du nœud « i » au nœud « j » ainsi que le poids du bord le long du chemin est pris en compte. S'il existe plus d'un chemin le plus court dirigé de i à j, alors le chemin avec un poids maximal (c'est-à-dire une force de connexion maximale) est pris en compte. De même, pour un graphe non pondéré non orienté, GRC peut être obtenu en excluant le calcul des poids du plus court chemin entre deux nœuds. De plus, la GRC est observée sur un modèle de hiérarchie ajustable (AH). Dans un modèle AH, tous les nœuds d'un arbre orienté sont affectés à un niveau « l » tel que le niveau du nœud racine est égal au nombre total de niveaux et ceux du niveau inférieur ont l = 1. Si un nœud a un niveau l, alors le niveau des nœuds enfants serait l − 1. Ensuite, un nombre supplémentaire d'arêtes aléatoires est inclus dans le modèle de telle sorte que 1 − p proportion d'arêtes est totalement aléatoire. C'est-à-dire que deux nœuds choisis, disons A et B, sont connectés s'ils n'étaient pas déjà connectés dans la direction (AB). La proportion p des arêtes est connectée en tant que (AB) uniquement si, pour préserver la hiérarchie. La randomisation des réseaux réels est effectuée en générant un réseau aléatoire avec le même degré d'entrée et de sortie par rapport au modèle d'origine, suivi du choix de deux bords aléatoires AB et CD, puis de la modification des extrémités pour obtenir AD et CB.

L'analyse sur quelques réseaux classiques tels que les graphes d'Erdős-Rényi (ER) [23] , les graphes sans échelle (SF) et les arbres orientés révèlent que les valeurs GRC sont plus acceptables que les écarts types des centralités d'atteinte locale pour mesurer les propriétés hiérarchiques. Le GRC pour un réseau hiérarchique ajustable (AH) s'avère changer de façon continue et monotone dans un intervalle d'un état hautement aléatoire à un état entièrement hiérarchique. Dans le cas de réseaux réels, les bords sont orientés de manière à ce que l'origine du bord ait un impact plus important sur le terminal. Il a été observé que le GRC dépend largement du degré moyen et de la structure du réseau. Un réseau avec un degré moyen plus élevé a un GRC plus petit indiquant l'existence d'une hiérarchie inférieure. Cependant, la comparaison de la valeur GRC réelle avec GRC des versions aléatoires des réseaux d'origine présente de légères variations. Afin d'analyser la corrélation entre la hiérarchie et la contrôlabilité d'un réseau, GRC est ensuite comparé au nombre de nœuds pilotes sous la dynamique du tableau de commutation. Ici, les nœuds pilotes sont des nœuds qui contrôlent l'état de chaque bord. Pour un contrôle total sur un réseau facilement contrôlable, le nombre de nœuds pilotes à contrôler sont peu nombreux. Les résultats ainsi obtenus ont tendance à présenter une corrélation négative entre les deux quantités, c'est-à-dire GRC et sont inversement proportionnels l'un à l'autre. Cela suggère clairement qu'un réseau hiérarchique est mieux contrôlable.

La technique de visualisation hiérarchique proposée pour les grands graphes affecte chaque nœud à différents niveaux sur la base d'une quantité locale. Pour un digramme non pondéré, cette quantité locale est égale à la centralité d'atteinte locale. Par conséquent, un graphe ER possède une structure hiérarchique à deux couches et l'arborescence a plusieurs couches. La structure d'un graphe SF se situe entre un graphe ER et une arborescence avec quelques couches clairement séparées. Pour éviter des mises en page hiérarchiques différentes pour des graphes uniques du même modèle de graphe, des ensembles de réseaux ER, SF, AH dirigés et réels sont visualisés. En bref, la mesure de hiérarchie proposée, GRC quantifie l'hétérogénéité de la centralité d'atteinte locale dans l'ensemble du réseau en introduisant des bords bidirectionnels parmi les nœuds équivalents. Il est exempt des inconvénients des mesures hiérarchiques suggérées jusqu'à présent. Par conséquent, on peut conclure que GRC est une mesure plus appropriée pour la hiérarchie dans n'importe quel réseau.

4. Classification des réseaux

Les réseaux peuvent être de différents types. Certains d'entre eux incluent:

1) Réseaux physiques comprenant des entités physiques et leurs interactions. Des exemples pourraient être le réseau routier, le réseau maritime mondial, etc., où les villes/ports sont des nœuds et leurs itinéraires sont des liens,

2) Les réseaux biologiques comme les réseaux d'interactions protéiques, les réseaux de régulation des gènes où protéines/gènes forment les nœuds et leurs interactions forment des liens,

3) Les réseaux sociaux où des personnes ou d'autres entités deviennent les nœuds en fonction du contexte social et leurs interactions étant des liens.

Réseau social, où les gens représentent des nœuds et la relation entre eux représente des liens. Un lien peut être soit dirigé (par exemple Twitter où la relation est directionnelle) soit non dirigé (par exemple Facebook où la relation est mutuelle). Réseaux physiques comme Réseau routier, Réseau maritime mondial. Ici, les nœuds sont représentés par des villes et des ports respectivement, et les liens sont représentés par des routes. Réseaux biologiques : L'un des exemples est le réseau d'interaction protéine-protéine où chaque protéine est un nœud et l'interaction entre elles est représentée par un lien.

Parmi tous les réseaux, nous nous concentrons principalement sur les réseaux sociaux. Il montre des propriétés différentes par rapport aux autres réseaux présents comme Internet, World Wide Web. Un réseau peut être classé en réseau d'infrastructure et réseau d'interaction. Dans les réseaux d'infrastructure, un lien peut être établi même si les nœuds n'interagissent pas les uns avec les autres. Des exemples typiques de réseaux d'infrastructure sont Facebook, Orkut, Twitter, etc. Dans le réseau d'interaction, un lien est établi entre les nœuds lorsqu'ils interagissent les uns avec les autres. Des exemples typiques sont le réseau d'interaction protéine-protéine, le réseau social Slashdot qui est le résultat d'une interaction entre les nœuds en raison de la discussion filaire. Une différence majeure entre les deux réseaux est qu'un lien peut perdre de son importance au cours du temps dans le réseau d'infrastructure, c'est-à-dire qu'un lien peut languir (ou en d'autres termes rester statique). Par exemple, si l'on n'interagit pas régulièrement avec une personne alors le lien qui les relie tous les deux perd de son importance avec le temps. Mais dans un réseau d'interaction, un lien ne perd jamais de son importance avec le temps, car les nœuds continuent d'interagir régulièrement les uns avec les autres.

Un réseau peut également être classé en réseaux signés et non signés. Dans les réseaux non signés, le lien entre les nœuds ne dit pas sur la nature du lien. Les réseaux sociaux en ligne comme Facebook, Twitter, friendster, etc. entrent dans cette catégorie. Contrairement au réseau non signé, dans un réseau signé, un lien porte un signe +1 qui représente une relation positive ou un signe -1 qui représente une relation négative entre les nœuds. Les deux signes peuvent être interprétés différemment dans différents réseaux. Par exemple, dans le réseau Eopinions, +1 représente la confiance tandis que -1 représente la méfiance, tandis que dans le réseau Slashdot Zoo, +1 représente l'amitié et -1 représente le navire ennemi entre les personnes.

5. Hiérarchie dans les réseaux signés

Jusqu'à présent, les études ne révèlent que certaines propriétés statistiques typiques partagées par la plupart des réseaux complexes. Certaines des propriétés distinctives incluent les phénomènes de petit monde [24] , les distributions de degrés de loi de puissance [25] , le clustering également appelé transitivité de réseau [26] , la détection de communauté [22] etc. Cependant, certains problèmes restent ouverts. La hiérarchie étant l'un de ces problèmes a attiré de nombreux scientifiques.

La connectivité est une propriété présente par tous les réseaux et elle détermine la disposition des nœuds au sein d'un réseau. Un tel arrangement donne lieu à différentes classes de nœuds en fonction de certains facteurs qui servent de mesure. Dans les réseaux sociaux en ligne, les acteurs ont tendance à se connecter entre eux au sein et à travers différentes classes sur la base de leur hiérarchie sociale perçue. Le concept de hiérarchie sociale peut être défini comme l'émergence d'une structure arborescente composée d'acteurs de haut en bas dans l'ordre de leurs rangs, décrivant une relation parent-enfant spécifique. Le prestige total détenu par un acteur pourrait être considéré comme une mesure de statut. Par conséquent, une hiérarchie sociale véhicule une structure d'autorité et pourrait être latente dans chaque réseau social et doit être extraite. Différentes littératures présentent une variété d'approches et de mesures pour la hiérarchie minière dans les réseaux complexes. Des tentatives ont également été faites pour miner la hiérarchie dans les réseaux sociaux. Ceux-ci sont discutés plus en détail dans la section de la littérature connexe. Cependant, dans les réseaux signés, la hiérarchie est beaucoup moins discernable. La présence d'interactions négatives dans les réseaux signés pose un défi supplémentaire dans la dérivation des hiérarchies de confiance à partir des réseaux signés. Par conséquent, nous soutenons que les notions traditionnelles sont insuffisantes pour dériver des hiérarchies sous-jacentes aux réseaux signés.

Afin d'extraire les hiérarchies des réseaux signés, nous avons considéré les réseaux Slashdot et Epinions [27] . Slashdot est un site Web lié à la technologie, doté d'une fonctionnalité nommée « Zoo » à travers laquelle chaque utilisateur se connecte à un autre utilisateur en tant qu'ami ou ennemi en fonction des commentaires d'une discussion sur un article. Dans l'ensemble de données, un ami est représenté par une arête dirigée de poids +1 et un ennemi par une arête dirigée de poids -1. Epinions est un site d'avis de consommateurs où les membres du réseau peuvent décider de se « faire confiance » ou non.

Dans ce travail, nous tentons d'exploiter les hiérarchies qui restent latentes dans un réseau signé qui représente la confiance des nœuds du bas vers la racine. Il est également basé sur le voisinage immédiat des relations de confiance d'un nœud. Par conséquent, la hiérarchie de confiance montre la nature des nœuds qui se font confiance et en même temps préserve la localité de confiance. Ces hiérarchies sont appelées hiérarchies de confiance préservant la localité.

Étant de nature très dynamique, les réseaux sociaux ont toujours reflété des modèles intéressants de connexions entre les nœuds. Ces connexions conduisent principalement à une relation parent-enfant formant des hiérarchies entre eux. La structure hiérarchique d'une population dans un réseau social façonne souvent la nature des interactions sociales des individus et, ainsi, donne un aperçu de la structure sous-jacente du réseau. Comprendre le mécanisme par lequel évoluent les hiérarchies est une question fondamentale qui reste encore floue. Notre approche pourrait être pertinente pour un certain nombre d'applications actuelles intéressantes des réseaux sociaux, notamment la diffusion d'informations, la détection de la structure communautaire et un cadre pour l'autonomie locale au sein de la population. Le cœur de notre travail réside dans le fait que nous cherchons à exploiter des hiérarchies basées sur la localité de confiance d'un nœud dans un réseau signé. C'est-à-dire que les hiérarchies devraient être une représentation abstraite de la structure de la communauté locale.

6. Interprétations des hiérarchies dans le réseau signé

Comme discuté précédemment, en raison de la présence d'interactions positives (confiance) ainsi que négatives (méfiance) dans les réseaux signés (réseaux de confiance), les notions traditionnelles de hiérarchie se sont avérées inadéquates pour dériver des hiérarchies de confiance. Dans le but de modéliser efficacement ces deux interactions dans une hiérarchie, nous introduisons deux interprétations de la confiance ou de la bonté dans les réseaux de confiance. La confiance est représentée sous deux aspects différents, à savoir la présence de confiance et l'absence de méfiance. En fait, ces deux interprétations pourraient être considérées comme des duels de confiance signifiant le degré de bonté d'un acteur. La présence de confiance impliquerait à quel point un acteur est bon, tandis qu'une absence de méfiance impliquerait à quel point l'acteur est réellement moins mauvais. Par conséquent, les hiérarchies de confiance ainsi obtenues seraient constituées de plusieurs acteurs classés dans l'ordre de leur degré de confiance. Cela pourrait être illustré dans la figure 3, comme suit :

Les figures 3 et 4 illustrent les hiérarchies basées sur la confiance existant entre les acteurs. Il convient de noter que dans un réseau de confiance, une méfiance élevée et une confiance faible ne doivent pas nécessairement être identiques. Dans la figure 3, la confiance gagnée est élevée au niveau du nœud racine, ce qui indique une qualité élevée et diminue progressivement à mesure que nous descendons dans la hiérarchie. C'est-à-dire que les acteurs au bas de la hiérarchie auraient une confiance comparativement plus faible que ceux au sommet. Sur la même note, dans la figure 4, l'absence de méfiance diminue à mesure que l'on descend dans la hiérarchie en commençant à la racine. C'est-à-dire qu'au nœud racine, l'absence de méfiance est beaucoup plus élevée

Figure 3 . Hiérarchie basée sur la présence de la confiance.

Figure 4 . Hiérarchie basée sur l'absence de méfiance.

à son tour indiquant une faible méchanceté par rapport à ceux au bas de la hiérarchie.

Alternativement, on pourrait considérer que la « bonté » diminue à mesure que nous descendons dans la hiérarchie de la confiance et que la « malveillance » augmente à mesure que nous descendons dans la hiérarchie de la méfiance. Ce point de vue pose la question de la manière dont un acteur est considéré comme véritablement bon ou mauvais. La philosophie derrière ce point de vue pourrait être expliquée en termes d'opinion collective de la population. Les réseaux sociaux sont constitués d'agents autonomes capables d'exprimer eux-mêmes leurs opinions. Ces opinions sont uniquement basées sur leurs processus cognitifs ou inférences indépendants. En d'autres termes, l'opinion d'un acteur n'est entravée par aucune partie ou groupe d'intérêt en particulier. Par conséquent, une opinion collective sur la fiabilité d'un acteur ne peut être exclue comme une coïncidence. Avec le temps, une architecture entièrement basée sur la confiance émerge. Cette architecture émergente basée sur la confiance devient finalement acceptable pour l'ensemble de la population. Ainsi, un acteur qui a gagné la confiance (méfiance) grâce à l'opinion unanime de la majorité est considéré comme véritablement digne de confiance (untrustworthy). Grâce à cette architecture émergente, il est possible d'acquérir de nouvelles connaissances sur les modèles sous-jacents d'un réseau. Un exemple intéressant à cet égard pourrait être l'édition collaborative du contenu des pages Wikipédia. Les lecteurs sont autorisés à modifier les informations relatives à un sujet particulier et au fil du temps, une architecture de l'information évolue pour finalement parvenir à un consensus parmi les éditeurs.

Cependant, afin de transmettre efficacement à la fois la confiance et la méfiance dans une même hiérarchie, la confiance ainsi que la méfiance gagnée par un acteur sont prises ensemble en termes de leurs valeurs globales de mérite. C'est-à-dire que le mérite du nœud u est l'agrégat de la confiance et de la méfiance qu'il gagne de ses voisins. La confiance/méfiance du nœud v au nœud u est atténuée en raison de son biais en faveur de la confiance ou de la méfiance de la population dans son ensemble. Par conséquent, plus le biais est élevé, plus l'effet du vote de v sur u est faible. Ainsi, une hiérarchie consolidée d'acteurs est formée au moyen d'une relation parent-enfant, à savoir. l'enfant fait confiance au parent. Ici, les acteurs sont classés en différents niveaux en fonction des valeurs méritées au sein de leur quartier de confiance. C'est-à-dire que la hiérarchie consolidée représente non seulement la confiance globale gagnée, mais préserve également la localité de confiance d'un acteur. Par conséquent, on dit que la hiérarchie ainsi obtenue représente une structure sociale basée sur la localité dans l'ordre décroissant des mérites agrégés.

7. Conclusions et travaux futurs

L'objectif principal de notre travail était d'exploiter les hiérarchies de confiance préservant la localité à partir de réseaux signés. Nous avons discuté des différentes approches adoptées pour exploiter des hiérarchies dans des réseaux complexes dans divers domaines allant de la sociologie à la biologie en passant par l'informatique. En plus de cela, nous avons expliqué pourquoi, contrairement à d'autres réseaux, les hiérarchies d'exploration dans les réseaux signés sont nouvelles. Dans les réseaux basés sur la confiance, il y a une démonstration explicite de confiance et de méfiance, très similaire aux interactions du monde réel. En conséquence, une architecture de confiance évolue, donnant lieu à une hiérarchie sociale sous-jacente. Ensuite, nous avons proposé les deux interprétations associées à la confiance dans les réseaux signés et observé la nature des hiérarchies dérivées des hypothèses ci-dessus.

Une future ligne de travail pourrait être une méthode de fusion des hiérarchies afin d'arriver au nombre (plus petit) de hiérarchies souhaité, sans compromettre la préservation de la localité pour examiner les modèles qui la sous-tendent. Mettre en œuvre d'autres hypothèses pertinentes pour la construction de hiérarchies préservant la localité en fonction du contexte de l'application. Dans le même ordre d'idées, nous prévoyons d'étendre notre approche et d'analyser également d'autres réseaux signés comme Essembly etc.


Benchmarking : faire confiance à nos modèles de mécanismes

Les inférences sur les processus dans les systèmes écologiques reposent en partie sur l'application de modèles de simulation qui génèrent des matrices aux propriétés prévisibles. Comme discuté dans la section précédente, la prolifération des métriques de réseau souligne la nécessité d'étudier et de comparer la façon dont ces métriques se comporteront dans le contexte de différents algorithmes de modélisation. Une fois qu'une métrique ou un algorithme a été choisi, il est tentant de les appliquer largement à des systèmes empiriques pour détecter des modèles, mais avant de poursuivre la recherche, un processus de « analyse comparative » avec des matrices artificielles qui ont des quantités prédéfinies de structure et d'aléatoire doit être utilisé pour examiner le comportement des algorithmes et les métriques qui leur sont appliquées.

Encadré 1 Analyse comparative des modèles écologiques

Le test le plus élémentaire consiste à alimenter l'algorithme avec un ensemble de matrices « aléatoires » pour s'assurer que la fréquence des résultats statistiquement significatifs n'est pas supérieure à 5 %. Sinon, l'algorithme est vulnérable à une erreur statistique de type I (rejetant à tort une véritable hypothèse nulle). Cependant, spécifier une matrice produite par des erreurs d'échantillonnage aléatoires n'est pas si facile. Par définition, si un algorithme de modèle nul est utilisé pour générer les matrices aléatoires, alors pas plus de 5 % d'entre elles ne devraient être statistiquement significatives (à moins qu'il n'y ait eu des erreurs de programmation). Pour les matrices binaires, deux distributions log-normales peuvent être utilisées pour générer une hétérogénéité réaliste dans les totaux des lignes et des colonnes, tout en conservant des effets additifs pour les probabilités d'occurrence des cellules (Ulrich et Gotelli 2010). Des matrices « structurées » sont nécessaires pour tester les erreurs de type II (accepter à tort une fausse hypothèse nulle), et celles-ci nécessitent un examen attentif du type de modèle ou de mécanisme que le test est conçu pour révéler. Une approche consiste à commencer par une matrice parfaitement structurée, telle qu'une dérivée d'un modèle mécaniste pour générer la structure du réseau, la contaminer avec des quantités croissantes de bruit stochastique et tester le modèle statistique à chaque étape (Gotelli 2000). Une parcelle de la P valeur par rapport au bruit ajouté devrait révéler une courbe croissante et indiquera le rapport signal sur bruit en dessous duquel le test ne peut pas distinguer le motif du caractère aléatoire. Alternativement, on peut commencer par une matrice purement aléatoire mais y intégrer une sous-structure non aléatoire, telle qu'une clique matricielle ou un nœud avec une centralité extrême. La taille, la densité et d'autres attributs de cette matrice peuvent être manipulés pour voir si le test peut toujours détecter la présence de la structure intégrée (Gotelli et al. 2010 ). Étant donné que tous les tests de modèle nul (et toutes les statistiques fréquentistes) sont affectés par la taille de l'échantillon et la structure des données, ces tests de référence peuvent être adaptés aux attributs des structures de données empiriques pour une meilleure focalisation et une meilleure inférence.

Même les algorithmes de randomisation simples peuvent nécessiter des filtres supplémentaires pour garantir que les matrices aléatoires conservent un certain nombre de propriétés de réseau souhaitables. Par exemple, Dunne et al. (2002) ont créé des matrices de réseaux trophiques aléatoires avec une richesse en espèces et une connectivité constantes, mais ils ont rejeté les réseaux avec des nœuds et des sous-réseaux non connectés car ces topologies n'étaient pas observées dans les réseaux empiriques. Un algorithme de « stub reconstruction » construit une topologie qui est contrainte au nombre observé d'arêtes par nœud (Newman et al. 2001 ). Chaque nœud se voit attribuer le nombre correct de bords, puis les nœuds sont successivement et aléatoirement appariés pour créer un réseau en pleine croissance. Cependant, cet algorithme génère également plusieurs bords entre les deux mêmes nœuds, qui doivent être rejetés ou pris en compte. Maslov et Sneppen ( 2002 ) utilisent un « algorithme de re-câblage local » qui préserve le nombre de connexions pour chaque nœud en permutant les bords de manière aléatoire entre différentes paires de nœuds. Cet algorithme est étroitement analogue à l'algorithme d'échange utilisé dans les analyses de cooccurrence d'espèces qui préserve les totaux des lignes et des colonnes de la matrice d'origine (Connor et Simberloff 1979 ). Plus il y a de contraintes ajoutées à l'algorithme, moins il est probable que des processus d'échantillonnage simples puissent expliquer les modèles dans les données. Cependant, certaines contraintes, telles que la connectivité ou la densité matricielle, peuvent par inadvertance « introduire clandestinement » les processus mêmes qu'elles sont conçues pour détecter. Cela peut conduire à ce que l'on appelle l'effet Narcisse (Colwell et Winkler 1984). Trouver le bon équilibre entre les contraintes réalistes et la puissance statistique n'est pas facile (Gotelli et al. 2012 ), et il existe de nombreux algorithmes potentiels qui pourraient raisonnablement être utilisés, même pour des matrices binaires simples (Gotelli 2000 ).

En théorie des réseaux, le modèle Erdos-Renyi (ER, Erdös et Rényi 1959) est un exemple désormais classique de modèle utilisé pour générer des réseaux via un processus aléatoire de création de structure matricielle. Le modèle ER est un graphe aléatoire qui commence par une matrice d'adjacence N × N de nœuds et lui attribue K bords entre des paires de nœuds choisis au hasard. Le modèle ER a été appliqué en écologie pour répondre aux questions sur la relation entre la stabilité et la complexité (mai 1972) et la structure des réseaux génétiques (Kauffman et al. 2003). Par exemple, des réseaux randomisés ont été utilisés pour lier des motifs (Milo et al. 2002 ) à l'assemblage de réseaux (Baiser et al. 2016 ), à la stabilité (Allesina et Pascual 2008 , Borrelli et al. 2015 ) et à la persistance dans les réseaux trophiques ( Stouffer et Bascompte 2010).

En plus des approches matricielles aléatoires des modèles nuls et ER, il existe d'autres algorithmes plus complexes qui sont utilisés pour générer des matrices structurées. L'un des plus connus en théorie des réseaux est peut-être le modèle de Barabasi-Albert (BA, Barabási et Albert 1999 ), qui ajoute des nœuds et des arêtes à un réseau en croissance avec une plus grande probabilité d'ajouter des arêtes aux nœuds avec un degré plus élevé. L'algorithme BA est similaire aux algorithmes de réseau écologique qui génèrent une structure non aléatoire, en raison soit d'une influence directe, soit de processus similaires opérant dans les systèmes d'intérêt. Certains de ces modèles incluent des processus d'« attachement préférentiel » dans lesquels les organismes ont tendance à interagir avec la même espèce commune. Des algorithmes de modélisation du réseau trophique ont également été développés qui utilisent une approche basée sur les traits (par exemple, Allesina et Pascual 2009), des modèles de ressources consommateurs (Yodzis et Innes 1992), des niches (Williams et Martinez 2000), des algorithmes de cyber-écosystème (Fath 2004 ) et les modèles en cascade (Cohen et Łuczak 1992 , Allesina et Pascual 2009 , Allesina et Tang 2012 ).

Le comportement statistique de certains modèles et métriques peut être compris analytiquement. Par exemple, les réseaux générés par l'algorithme BA affichent des distributions de degrés qui se rapprochent d'une distribution de loi de puissance, comme de nombreux réseaux « sans échelle » du monde réel (Albert et al. 2002 ). Si le réseau est clairsemé (c'est-à-dire, [K ≪ N 2 ]), la distribution des degrés du réseau doit suivre une distribution de Poisson. Cependant, à mesure que de nouveaux modèles et mesures sont introduits, de nouvelles analyses comparatives doivent être effectuées et comparées aux résultats précédents. Newman et al. ( 2016 ) est un exemple de la façon dont l'analyse comparative peut être utilisée pour étudier les processus opérant sur les réseaux écologiques. Ludovisi et Scharler ( 2017 ) préconisent la même approche pour l'analyse des modèles de réseaux en général. Le progiciel de référence (Eugster et Leisch 2008) dans R (R Core Team 2017) est un progiciel général de test d'algorithmes qui fournit un point de départ utile.


Réseaux écologiques : plonger dans l'architecture de la biodiversité

Ces dernières années, l'analyse des réseaux d'interaction est devenue populaire comme cadre pour explorer les processus écologiques et les relations entre la structure de la communauté et son fonctionnement. Le domaine est rapidement passé de ses balbutiements à une jeunesse dynamique, comme en témoignent la variété et la qualité des discussions tenues lors du premier symposium international sur les réseaux écologiques à Coimbra—Portugal (23-25 ​​octobre 2013). La réunion a rassemblé 170 scientifiques de 22 pays, qui ont présenté des données provenant d'une large gamme géographique et couvrant toutes les étapes des analyses de réseau, des stratégies d'échantillonnage aux moyens efficaces de communiquer les résultats, présentant de nouveaux outils analytiques, l'incorporation de dynamiques temporelles et spatiales, de nouvelles applications et des outils de visualisation. 1 Au cours de la réunion, il est devenu évident que bien que de nombreuses mises en garde diagnostiquées dans les premières études de réseau soient traitées avec succès, de nouveaux défis surgissent, attestant de la santé de la discipline.

1. Introduction

« Je suis tenté de donner un exemple de plus montrant comment les plantes et les animaux, les plus éloignés à l'échelle de la nature, sont liés entre eux par un réseau de relations complexes » [1, p. 74]. Cette célèbre citation de C. Darwin résume le principe central de l'écologie et montre clairement pourquoi la théorie des réseaux offre un si grand potentiel pour faire progresser notre compréhension des processus écologiques. Les réseaux sont des constructions de nœuds interconnectés, délimités soit par un espace pauvre en liens, soit par d'autres décisions méthodologiques du chercheur. Dans la nature, les réseaux sont des structures dynamiques spatio-temporelles organisées hiérarchiquement, à partir d'atomes interconnectés, de molécules, d'organites cellulaires, d'organes, d'individus, de populations, d'espèces, de communautés, d'écosystèmes et finalement de la biosphère. Dans le domaine écologique, les interactions jouent un rôle déterminant dans la dynamique des populations, la coévolution des espèces et la structure des communautés, affectant les fonctions remplies par les écosystèmes et les services qu'ils rendent à l'homme. Les réseaux sont particulièrement attrayants pour les écologistes car ils fournissent un point de vue dynamique à partir duquel les scientifiques peuvent simultanément « voir la forêt et les arbres », c'est-à-dire évaluer les propriétés émergentes au niveau du réseau et en même temps considérer le comportement et le rôle fonctionnel des nœuds. En d'autres termes, la « pensée en réseau » en écologie offre non seulement une manière élargie d'examiner la biodiversité, mais également une approche mécaniste pour évaluer les processus qui sous-tendent les modèles complexes que nous observons dans la nature.

Depuis les années 1970, lorsque les réseaux ont été importés de la physique et des sciences sociales dans l'écologie, ils sont devenus de plus en plus populaires parmi les écologistes (figure 1). Lors de la construction du Status Quo de l'analyse de réseau complexe, des voies de recherche prometteuses ont souvent été répertoriées comme des moyens de faire progresser le domaine [2,3]. Il a été encourageant de voir au cours de cette réunion que nous réalisons maintenant des progrès très importants dans l'exploration de bon nombre de ces « recoins sombres », tels que le passage de réseaux statiques à des réseaux dynamiques dans le temps, la construction de réseaux de réseaux, la cartographie de réseaux individuels, l'identification de moteurs des modèles de liens généraux, tels que la modularité, encadrant la coévolution dans un contexte de réseau et en utilisant de plus en plus la science des réseaux comme outil de conservation pratique.

Figure 1. Proportion de la masse des articles écologiques publiés depuis 1985 qui incluent le terme « réseau(s) » dans leur titre, leurs mots-clés ou leur résumé. Les données extraites du Web of Science ont été consultées en octobre 2013. Termes de recherche : Sujet = (Réseau*) et Année de publication = (1985-2012) et Catégorie = (Écologie).

2. Améliorer les réseaux écologiques

Indépendamment du potentiel proclamé des réseaux pour faire avancer la théorie et la pratique écologiques, les généralisations plus larges et les applications pratiques de cette approche sont encore relativement modestes. Au cours du symposium, nous avons identifié certains défis généraux que les réseaux doivent surmonter afin de réaliser leur plein potentiel. Nous avons regroupé ces défis en trois grandes catégories, que nous discutons ci-dessous.

(a) De plus en plus réaliste

La précision des informations tirées de l'analyse des réseaux d'interaction est principalement limitée par la qualité des données. Les réseaux sont des représentations simplifiées de la réalité, qui sont nécessaires pour extraire les schémas d'ensemble de ce qui semble un « monde infiniment merveilleux et complexe [4]. Cependant, les limites inférieures de cette simplification doivent être basées sur des critères scientifiques solides, tels que la résolution des taxons, les frontières de l'habitat naturel et des processus clairement délimités, et non par les « zones de confort » des chercheurs. De même, cette « simplification » ne peut justifier un mauvais échantillonnage. À cet égard, il est devenu évident que de la même manière que les écologistes ont construit un solide corpus de théories pour l'échantillonnage des individus et des espèces, une théorie pour l'échantillonnage des interactions doit encore être développée, par ex. des lignes directrices pour définir un effort minimum acceptable ou de meilleures façons de traiter les ensembles de données incomplets. Une telle étape sera importante pour s'attaquer à l'un des problèmes les plus persistants sur le terrain : la a postériori comparaison de réseaux assemblés par différents chercheurs à des fins différentes, qui varient considérablement dans leurs protocoles d'échantillonnage et leurs efforts [5].

La difficulté de quantifier l'efficacité des procédés étudiés, par ex. la pollinisation ou la dispersion des graines, amène souvent les chercheurs à se concentrer sur des processus connexes et à les utiliser comme proxy, par ex. la fréquentation des fleurs et le frugivorisme comme substituts des réseaux de pollinisation et de dispersion des graines. Bien que ces proxys contiennent des informations précieuses, il est important d'être clair sur le processus écologique réel exprimé par les données, c'est-à-dire quel type d'«information» circule à travers les liens du réseau et sa signification écologique. Une quantification correcte du résultat et de l'efficacité du processus écologique réel d'intérêt sera inestimable pour conduire à des conclusions pertinentes.

En fin de compte, le réalisme d'un réseau, c'est-à-dire à quel point il reflète des phénomènes réels, dépend des couches d'informations qu'il contient.Par exemple, tous les nœuds d'un niveau trophique sont fréquemment considérés comme égaux et chacun de ces nœuds est formé par un assemblage d'individus « répliqués » (indépendamment de leur âge, sexe, taille, statut social, etc.). Une piste intéressante pour explorer l'importance de la nature des éléments constitutifs du réseau consiste à déterminer si les réseaux basés sur les espèces et sur les individus offrent des informations complémentaires ou divergentes.

(b) De plus en plus informatif

La première génération de réseaux écologiques a cartographié les liens observés entre les nœuds sans chercher à estimer leur importance relative. Ces études de réseau qualitatives sont à la base de la deuxième génération de réseaux quantitatifs/pondérés dans lesquels le poids de tous les liens observés est évalué dans une devise commune, par ex. fréquence d'interaction ou biomasse. L'incorporation du poids des liens dans les matrices d'interaction représente une énorme augmentation de la valeur informative. D'autres sources d'information beaucoup moins fréquentes sont les estimations indépendantes de l'abondance des espèces, les traits des nœuds (discutés ci-dessus) et les données de réseau résolues spatialement et temporellement.

Alors que les réseaux continuent à incorporer des informations plus détaillées (par exemple, données temporelles et spatiales, type d'interaction), les représentations graphiques classiques deviendront très probablement moins efficaces pour visualiser ces informations. La possibilité de représenter la complexité des interactions dans des diagrammes relativement simples et attrayants a été l'une des plus grandes avancées de l'écologie des réseaux. Par conséquent, nous envisageons que de nouveaux outils de visualisation qui intègrent de nouvelles couches d'informations, par exemple une caractérisation détaillée des nœuds et des liens, puissent nécessiter le développement de nouvelles routines graphiques, telles que des interfaces interactives, des capacités de zoom améliorées et une interaction avec des outils visuels géoréférencés (par exemple Google Terre, SIG).

Alors que l'écologie des réseaux est poussée en avant et de plus en plus utilisée pour explorer la dynamique des communautés et les processus mécanistes qui déterminent les fonctions des écosystèmes, le choix des descripteurs et des indices les plus appropriés du comportement des systèmes doit être fait avec soin. Plutôt que d'utiliser la myriade de métriques produites par un logiciel spécifique, il est important de décider avec soin quelles variables de réseau ont la valeur la plus heuristique pour une étude donnée. Alors que la littérature sur les réseaux non biologiques continuera d'avoir un grand potentiel d'orientation pour notre choix de métriques, il est important de garder à l'esprit les spécificités des données/problèmes écologiques. Par exemple, les modèles nuls sont des outils importants pour traiter des ensembles de données incomplets, cependant, il n'y a pas de modèles nuls complètement "à toute épreuve" (par exemple pour l'imbrication ou la modularité), et l'acceptation de certaines hypothèses gonflera probablement le type I ou le type II taux d'erreur. Bien que l'analyse de réseau soit utile, ce n'est pas toujours, bien sûr, la meilleure approche pour une question écologique spécifique.

(c) De plus en plus utile

Les avantages d'une approche en réseau pour la planification de la conservation et en tant qu'outil de suivi sont fréquemment répertoriés mais beaucoup moins souvent traduits en une contribution significative pour les gestionnaires de la conservation. Cela peut s'expliquer en partie par le manque d'ensembles de données complets pouvant fournir une base solide pour la planification de la conservation, mais aussi par le manque fréquent de communication entre scientifiques et praticiens et la difficulté d'établir de bonnes collaborations mutualistes à long terme. Pourtant, une telle coopération entre scientifiques, praticiens et politiques est inestimable pour rendre l'analyse de la complexité des réseaux utile pour in situ préservation. À cet égard, le résultat le plus souhaitable est la formulation de règles empiriques qui peuvent être facilement communiquées à un large public. Des signes positifs d'un rôle plus appliqué des réseaux ont été présentés lors de la réunion de Coimbra et comprennent la mise en œuvre d'une analyse de réseau comme a priori outil de planification en lutte biologique, urbanisme, contrôle des espèces envahissantes et identification des zones prioritaires pour la conservation.

3. Conclusion

Au cours de cette réunion, il est devenu évident que les « webbers » [4] ont encore beaucoup à gagner à rechercher en permanence des avancées dans des domaines partiellement chevauchants, tels que la biologie évolutive, la génétique du paysage, l'écologie comportementale et la phylogéographie, ainsi que d'autres disciplines formelles, notamment physique, sciences sociales et mathématiques (en particulier la théorie des graphes). Par exemple, les analyses et développements récents dans les domaines de la mécanique statistique (physique) et de la socioéconomie peuvent fournir de nouveaux outils pour aborder les problèmes liés aux réseaux hautement dynamiques dans le temps ou à la structure fractale des « réseaux de réseaux ». Ainsi, nous prévoyons que les connaissances interdisciplinaires continueront d'être extrêmement bénéfiques pour l'application d'outils de réseau complexes en écologie.

Les études expérimentales sont cruciales pour augmenter le pouvoir prédictif des réseaux écologiques, en particulier pour évaluer la robustesse et la résilience des communautés. Étant donné les limites logistiques et éthiques de la manipulation de communautés entières, cela peut être fait soit en utilisant une approche de mésocosme, soit en tirant parti de changements écologiques à grande échelle, par ex. incendies intenses, émergence de nouvelles îles, changements massifs dans l'utilisation des terres. Ces données seront très précieuses pour construire des modèles plus réalistes, qui intègrent le potentiel de recâblage des interactions.

La théorie des réseaux fournit aux écologistes un outil important pour explorer le réseau complexe d'interactions de la nature. Cependant, la boîte à outils des réseaux doit encore être améliorée afin de tirer le meilleur parti de cette approche prometteuse. Bien qu'il ne soit pas toujours facile de distinguer les motifs du bruit lors de la comparaison des données communautaires, nous avons une confiance renouvelée que l'analyse de réseau est un outil des plus précieux pour essayer de comprendre la complexité de la banque enchevêtrée de la nature [1]. La première réunion a nourri le sentiment général que nous devrions bientôt nous réunir à nouveau, et donc un deuxième symposium est prévu pour être organisé à l'Université de Bristol, Royaume-Uni en 2015.

« Bien que de nombreuses modes se soient succédées dans la complexité, une chose est de plus en plus claire : l'interconnectivité est si fondamentale pour le comportement des systèmes complexes que les réseaux sont là pour rester » [6, p. 413].


1. Introduction

Un réseau est un ensemble d'objets (également appelés sommets, ou nœuds), avec des connexions entre eux, également appelées arêtes [2,44,54,49,25,48]. En tant que tel, il s'agit d'une construction mathématique qui modélise les relations entre objets, où les relations examinent les connexions entre un objet et le reste du réseau ou plus généralement entre des sous-ensembles d'objets, également appelés clusters ou communautés. Les réseaux sont donc des outils qui peuvent capturer les interconnexions entre objets et permettre l'analyse de ces connexions : ils sont devenus omniprésents dans de nombreux domaines de la science, avec des définitions différentes des nœuds et des bords. En biologie par exemple, les objets (nœuds) peuvent être des gènes, des protéines, des neurones, des organismes individuels, des espèces, etc. exemples [54,32,58,6,7]). Les applications de l'analyse de réseau incluent également les réseaux d'amitié, le World Wide Web, les modèles de maladies, entre autres [48,27].

Les modèles statistiques formels pour l'analyse des données de réseau ont émergé comme un intérêt majeur de la recherche (voir les articles de revue récents par Airoldi et ses collègues [25] et par Kolacyzk [30]). Il existe deux types principaux de tels modèles statistiques : les modèles de réseau statiques qui se concentrent sur l'explication des relations observées sur la base d'une seule version du réseau, et les modèles de réseau dynamiques qui concernent les mécanismes qui régissent les changements dans le réseau au fil du temps. Nous nous concentrons sur le premier, à savoir sur le démêlage des schémas relationnels compliqués et alambiqués contenus dans un réseau donné [11, 49]. Les modèles statistiques statiques sont courants dans l'analyse des réseaux sociaux, car ils fournissent un cadre pour calculer des métriques qui quantifient les structures à différents niveaux d'organisation des nœuds (individus, groupes, communautés). En écologie comportementale par exemple, ces métriques sont ensuite utilisées pour tester des hypothèses concernant les relations entre les attributs d'un nœud et sa position dans un réseau (pour revue, voir Croft et al. [18]). La plus courante de ces hypothèses est l'hypothèse nulle. Les biologistes du comportement reconnaissent que l'utilisation de tests significatifs d'hypothèse nulle nécessite de la prudence [61]. En particulier, il nécessite la définition d'hypothèses nulles qui peuvent éventuellement être vraies, ainsi que des considérations particulières pour ses applications aux données de réseau. En effet, les réseaux représentent des données et des métriques relationnelles qui ne sont pas indépendantes [31], rendant les méthodes statistiques qui supposent l'indépendance inappropriées. Pour tenir compte de la dépendance des relations dans le réseau, on pense que la meilleure approche est de construire des modèles nuls basés sur des randomisations des réseaux [40, 18]. Dans cet article, nous nous concentrons sur la façon de générer de tels réseaux aléatoires qui se conforment à un réseau observé.

Il existe de nombreuses façons de randomiser un réseau donné (voir [18] pour une brève revue) dont les applications dépendent du problème. Si les bords du réseau sont bien implantés, il est possible de permuter les affectations des objets avec les nœuds du réseau, en gardant les bords xés : cela permet de mesurer l'importance des positions au sein du réseau. Dans la plupart des applications, cependant, l'hypothèse nulle se concentre sur les relations, auquel cas il est préférable de randomiser les bords. Il existe de nombreuses options pour effectuer ce dernier. Le plus simple est de supposer que les interactions sont également probables entre les nœuds du réseau, auquel cas les bords peuvent être réarrangés de manière aléatoire. Cependant, il est peu probable que la plupart des réseaux réels satisfassent à cette hypothèse. Il est alors nécessaire de contraindre la randomisation de telle sorte qu'elle soit conforme à la structure (géométrie) du réseau. Cela nécessite que la géométrie du réseau soit connue, le problème dit d'extraction de communauté [46,25,4,21], et que cette géométrie soit traduite en contraintes pour la génération aléatoire d'arêtes. Cette tâche reste un défi pour la communauté d'amorçage de réseau [20,43,57].

De nombreuses méthodes ont été développées pour détecter des structures dans des réseaux complexes [4]. Beaucoup de ces méthodes se concentrent sur la maximisation du nombre de relations au sein des communautés du réseau tout en minimisant les liens entre les communautés, en utilisant des approches algorithmiques [46]. Une autre classe de méthodes s'appuie sur un modèle statistique du réseau pour estimer sa structure de communauté à travers un processus d'optimisation. Les modèles de blocs sont probablement les plus courants parmi ces méthodes [59,51,1,63]. La plupart de ces méthodes souffrent de l'incapacité de prendre en compte les grandes fluctuations des caractéristiques des nœuds qui sont observées dans les réseaux complexes du monde réel (telles que les différences dans le nombre de connexions qu'ils établissent au sein d'une communauté, la présence de sous-géométries au sein communautés, présence de communautés qui se chevauchent, etc.). Des efforts récents ont été faits pour corriger de tels effets [55,28,65]. Cela reste encore un domaine d'étude.

Les méthodes traditionnelles de modèles génératifs de réseaux aléatoires traduisent la géométrie du réseau de référence sous forme de contraintes sur le nombre de connexions que chaque nœud fait, ce que l'on appelle le degré d'un nœud. Cette stratégie a été implémentée dans les modèles de blocs [45], elle ignore cependant une propriété observée dans de nombreux réseaux du monde réel, à savoir le clustering ou la transitivité. A savoir, il y a une forte probabilité que deux nœuds qui sont connectés à un troisième nœud soient connectés l'un à l'autre. Il y a eu des tentatives pour tenir compte de cet effet de regroupement lors de la génération de réseaux aléatoires [56,15,47,37,36,38]. Cela reste un problème pour générer des graphes aléatoires.

Dans cet article, nous proposons une nouvelle approche pour générer des réseaux aléatoires qui « » un réseau de référence qui résout simultanément les défis de détecter la structure de l'organisation hiérarchique de la communauté et d'intégrer cette géométrie dans le processus de génération. L'essence de notre approche réside dans le sens que nous donnons au mot mimétisme : tous les réseaux bootstrap sont construits de telle sorte qu'ils possèdent toutes (ou au moins la plupart) des caractéristiques globales intégrées dans le grand réseau donné. Les caractéristiques globales d'un intérêt particulier sont les caractéristiques multi-échelles qui sont calculables et qui peuvent idéalement démêler des modèles relationnels compliqués et alambiqués d'interactions au niveau des clusters. Ces modèles multi-échelles sont mieux représentés avec une hiérarchie sur les nœuds sujets. Cette hiérarchie peut être vue comme un arbre composé de plusieurs niveaux d'échelle de décomposition de la communauté. Comme un arbre est intégré à une ultramétrique, cette hiérarchie relationnelle est une géométrie relationnelle. Nous soutenons du point de vue de la mécanique statistique que cette géométrie basée sur les données est une base réalisable pour résoudre les défis susmentionnés.

Ce document est organisé comme suit. Dans la section suivante, nous donnons un aperçu complet de notre méthode d'amorçage, qui sous-tend son fondement dans la capture de la géométrie ultramétrique du réseau d'intérêt. La section suivante décrit les algorithmes que nous avons développés pour mettre en œuvre cette méthode. La section des résultats décrit six applications sur des réseaux binaires non orientés simulés et réels. Nous concluons l'article par une discussion sur les implications de notre méthode sur la modélisation des réseaux, en particulier sur l'entropie des réseaux de calcul.


Méthodes

Préliminaires de la théorie des graphes

Pour présenter les nouvelles mesures théoriques de l'information pour les graphes étiquetés (pondérés), nous exprimons quelques préliminaires théoriques des graphes [14, 57, 75-77].

Définition 1est un graphe fini et non orienté. Dans cet article, nous supposons toujours que les graphes considérés sont connectés et n'ont pas de boucles.

Définition 2 Soit G un graphe fini et non orienté. ??(v) est appelé le degré d'un sommet v V et est égal au nombre d'arêtes e E qui sont incidents avec v.

Définition 30 (vous, v) représente la distance entre u V et v ∈ V exprimée comme la longueur minimale d'un chemin entre u,v. De plus, la quantité ??(v) = maxvousV(vous, v) est appelée l'excentricité de v V. ??(g) = maxvV??(v) est appelé le diamètre de G.

Définition 4 Nous appelons

la j-sphère d'un sommet v jeconcernant G.