Principes de base d’une « vie artificielle »

(ce texte correspond à l'annexe 1 du livre "Le Paradigme organiciste")

Dr Jean STEVENS (2015)

 

Le but de cette discipline nouvelle appelée la « vie artificielle » (VA) est de mimer l’intelligence des systèmes biologiques élémentaires de façon à pouvoir réaliser, comme tente de le faire depuis longtemps l’intelligence artificielle (IA), des systèmes virtuels capables de résoudre des problèmes qui nous préoccupent et qui sont trop complexes pour être résolus mentalement ou calculés par des d’équations savantes.

Dans cette entreprise, il ne faut pas perdre de vue que l’ordinateur, l’outil utilisé par cette VA, est une machine artificielle dont le comportement est strictement déterministe, contrairement à ce qu’il se passe, comme je le montre dans « Le Paradigme Organiciste » (ici noté « PO »), dans un système biologique réel. Nous devons donc à mon avis renoncer à « créer la vie » avec nos machines tout comme les physiciens au XIXème siècle ont dû renoncer à créer le mouvement perpétuel après avoir pris conscience de l’universalité du second principe.

La machine, fut-elle informatique, est un objet qui n’a et n’aura jamais ni intelligence propre ni vie spontanée. Elle ne devient « vivante » que si nous mettons en mouvement ses éléments de l’extérieur et l’alimentons en énergie. Elle  ne devient « intelligente » que dans la mesure où nous introduisons dans sa structure du sens-signification (sens-S) et ce sens se réfère nécessairement à notre finalité propre de sujets humains. La cellule vivante, elle crée réellement du sens-S mais ce sens se réfère à sa propre finalité d’organisme microbien. Un système auto-organisé (naturel ou artificiel) sera toujours, disait Ashby, « égoïste » parce que sa finalité propre vise avant tout à assurer son improbable stabilité dynamique.

L’hypothèse nouvelle proposée par les chercheurs en VA est qu’une intelligence collective très puissante peut émerger d’un système complexe sans qu'il ne soit nécessaire de programmer cette intelligence. Nous ne devrions donc programmer que l’ « intelligence » simple, voire élémentaire, des composants (en fait des réflexes automatiques) en laissant le système évoluer spontanément suivant des règles simples. Les systèmes virtuels les plus connus, les algorithmes génétiques, les automates cellulaires et les réseaux de neurones me semblent encore, malgré leurs noms très biologiques, fort éloignés des processus vivants.

Ce que je propose ici est une application de cette même hypothèse de base de la VA mais qui s’appuie directement sur l’analyse du mouvement organisé de la vie cellulaire tel que je l’ai présenté dans le « PO ». L’intelligence cellulaire apparaît effectivement comme une propriété émergente d’un réseau complexe de protéines, le réseau métabolique.

Chaque protéine réalise, dans un réseau métabolique réel, une fonction de transformation relativement simple. Elle intègre un ensemble de données « entrantes » (matérielles et informationnelles) et les traduit, par sa transconformation, en un comportement actif qui provoque une modification des paramètres matériels et/ou informationnels de son environnement, c'est-à-dire ses « sorties ». Elle semble de ce fait opérer un calcul qui pourrait théoriquement être géré par un algorithme simple.

Pour mimer cette fonction de transformation des protéines nous devons attribuer aux « agents » virtuels élémentaires des capacités de calcul qui n’existent pas dans la réalité. Une protéine réelle réagit aux informations de son environnement (ses entrées) en se transconformant, et c’est ce mouvement qui, en modifiant ses interactions avec son environnement crée une nouvelle « sortie ». Sa « réflexion » de macromolécule se limite en réalité à chercher dans l’espace de ses configurations la posture la plus stable possible compte tenu de ses contraintes environnementales, c’est à dire de la « pression thermomécanique » exercée par l’eau environnante et de la présence ou non de molécules de ligands qu’elle reconnaît (ce « mécanisme » de l’organisation dynamique des protéines et de leurs transconformations est expliqué en détail dans le PO).

Le réseau multiprotéique

La recherche en VA devrait donc à mon sens explorer les ressources potentielles de tels réseaux multiprotéiques virtuels tout comme l’IA tente de le faire en explorant des réseaux neuronaux virtuels.

La cellule est, comme nous l’avons vu, un système naturel qui, en s’auto-organisant s’auto-définit par rapport à son environnement. Il faut donc impérativement intégrer cette définition et cette distinction système/environnement dans le système artificiel,  en créant un « espace cellulaire » et un « espace environnemental ». Les deux seront à la fois clairement séparés l’un de l’autre par une membrane cellulaire virtuelle et reliés les uns aux autres par différentes fonctions de transformation de protéines membranaires.

Chacun de ces deux « espaces » abrite un certain nombre de « réservoirs » qui peuvent aisément être symbolisés par un paramètre quantitatif, une valeur instantanée traduisant l’état de remplissage du réservoir à chaque temps « t » et recalculé à chaque itération du système.

Même les réservoirs de protéines auront une telle valeur puisque les protéines cellulaires sont incessamment construites et détruites, ce qui permet à la cellule de réguler leur fonction (régulation génétique par opposition à allostérique). Elle servira, dans le calcul qu’elles réalisent, de coefficient multiplicateur de leur fonction de transformation.

De plus, le système cellulaire est un système dynamiquement intriqué à cet environnement.  Le mouvement métabolique, nous l’avons expliqué dans « PO », trouve son origine dans la « pente thermodynamique » naturelle qui  lie les réservoirs extérieurs d’aliments (glucose et oxygène par exemple) à ceux de déchets (CO2). Nous devons donc prévoir des conditions dans l’espace environnemental telles que cette pente spontanée soit toujours assurée de façon à ce que le système cellulaire ne s’arrête jamais de travailler. Pratiquement, cela signifie qu’il faudra « alimenter » en continu les réservoirs extérieurs d’aliments et « évacuer » en continu les réservoirs de déchets.

Une fois le flux alimentait le « moulin métabolique » (entrées et sorties « matérielles ») assuré, nous allons pouvoir complexifier à souhait le système en créant, entre ses entrées et sa sortie de multiples « voies métaboliques » et en créant de entrées informationnelles provenant de l’espace environnemental et se prolongeant sous forme de flux informationnels internes.

En commençant par des systèmes très simples, nous observerons comment le système cellulaire se comporte globalement face à des perturbations informationnelles aléatoires de son environnement. L’idée sous-jacente est que l’intelligence du système consistera  à s’adapter à cet environnement (le « problème posé ») en « transitant » d’un état dynamique stable à un autre. L’intelligence du système sera donc d’autant plus performante qu’il est complexe (loi de la diversité requise). La condition nécessaire à ces transitions est que le système reste en état de mouvement incessant mais stable dans des environnements de plus en plus variés. Le système se montrera ainsi capable de « comprendre » son environnement puisqu’il sera capable d’annuler ses effets perturbateurs sur son homeostasie.

Les protéines virtuelles

J’appellerai l’ « agent » élémentaire de tels systèmes une « protéine virtuelle » (PV). Cette PV doit être capable de réaliser un calcul relativement simple. Elle doit mimer la fonction de « vanne sélective contrôlable » (VSC) de la protéine, fonction commune à toutes les protéines cellulaires. Il nous faut donc implémenter une « fonction de transformation » plus ou moins complexe en créant pour chaque PV un petit algorithme spécifique qui, à partir des données (entrées) de son « environnement subjectif » immédiat (c'est-à-dire les molécules-paramètres auxquels il est sensible), va calculer automatiquement et à chaque itération, la réponse adéquate qu'il va imposer à ce même environnement (sortie). La PV est donc la traduction in silico de ce que j’ai appelé le « réflexe protéique », un réflexe qui se distingue du réflexe neurologique par son caractère automatique, immédiat et déterministe et donc par sa calculabilité.

Notons bien que c’est ici que nous injectons du sens-S dans le système en attribuant aux éléments de base (les « agents » du système) une intelligence mathématique (calcul) qu’ils n’ont pas dans la réalité. Nous ne réfléchissons et ne construisons pas, au départ, une quelconque structure globale. Nous espérons que, si notre hypothèse de l’émergence est exacte, la structure dynamique du réseau inter-protéique va se créer d’elle-même sous forme d’un comportement collectif émergeant des règles déterministes de comportement de ses différents agents, les PV.

De même que nous avons classé les protéines cellulaires en quatre catégories distinctes (cfr « PO »), il faudra créer quatre types distincts de PV, des transporteurs membranaires, des récepteurs membranaires, des enzymes et des récepteurs génétiques. On pourrait également assimiler la membrane cellulaire à une fonction de transformation un peu particulière en raison de sa très faible spécificité.

La fonction de transformation générale d’une PV peut s’écrire sous forme d’un calcul et d’une formule assez simple. A chaque itération du système, la PV « entre » dans son système de calcul les paramètres de son environnement auxquels elle est spécifiquement sensible, c'est-à-dire la concentration des molécules qu’elle est capable de reconnaître. Elle opère à partir de ces données et de son programme personnel le calcul particulier spécifique à chaque type de PV et elle réagit sur son environnement en modifiant les paramètres correspondant à ses sorties.

- L’enzyme virtuelle par exemple va « entrer » dans son calcul la concentration cytoplasmique de ses substrats et produits spécifiques ainsi que la concentration de ses éventuels modulateurs allostériques. Elle va alors calculer, en fonction de son programme propre le flux maximal théorique d’une « unité » d’enzyme. Ce programme doit prévoir une certaine constante d’équilibre de la réaction qu’il catalyse, calculer l’écart à l’équilibre de l’état actuel de ses substrats et produits et connaître la vitesse maximale théorique de catalyse d’une unité enzymatique. Ce résultat intermédiaire sera alors multiplié par le nombre d’unités enzymatiques présentes à l’instant « t » dans le réservoir protéique spécifique et divisé par un coefficient représentant la somme globale des effets allostériques agissant, à l’instant « t » sur la PV.

Comme expliqué dans « PO », certaines protéines que nous disons « activées » par un modulateur allostérique sont en réalité sous l’influence continue (« tonique ») mais hélas non explicite d’un inhibiteur. Ce que nous prenons pour un effet activateur n’est alors en réalité qu’un effet désinhibiteur passager (« phasique »). Le coefficient modulateur est donc toujours un diviseur de la fonction maximale de la vanne protéique (ce qu’on pourrait appeler sa sauvagerie catalytique spontanée ou intrinsèque).

- Le récepteur membranaire virtuel, lui, va entrer dans son calcul la concentration extérieure du stimulus auquel il est sensible et les éventuelles concentrations de ses modulateurs allostériques. Il va alors calculer si, en fonction d’une certaine valeur seuil, il va, oui ou non, exprimer à son pôle intracellulaire l’information qui est sa sortie spécifique. Cette sortie sera perçue alors par les sites allostériques d’enzymes dans l’espace cellulaire. On peut également imaginer simuler, comme dans la cellule réelle des enzymes membranaires qui sont des enzymes classiques dont le (ou un des) site(s) allostérique(s) perçoit une information dans l’espace environnemental.

-Le transporteur membranaire virtuel entre dans son calcul, un peu comme le fait son homologue enzymatique, la concentration de son substrat spécifique dans l’espace environnemental et dans l’espace cellulaire ainsi que la concentration de ses éventuels modulateurs allostériques. Il calcule alors, en fonction de la vitesse maximale théorique de transport d’une unité protéique et de l’écart à l’équilibre au temps « t », le nombre de molécules de substrat transportables par une unité protéique en une unité de temps. Il multiplie alors ce résultat par le nombre d’unités protéiques présentes au temps « t » et il le divise par le résultat global des modulateurs allostériques présents au temps « t ».

- Les récepteurs génétiques, ont pour fonction, dans une cellule réelle, d’augmenter ou diminuer, partiellement ou totalement, le nombre d’unités protéiques contenues dans chaque réservoir particulier de protéines. Dans un réseau protéique visant à mimer l’intelligence cellulaire pour l’utiliser à notre propre fin, il n’est pas nécessaire de mimer les processus complexes de transcription (de l’ADN en ARNm) et de traduction (de l’ARNm en protéine). Il suffit de prévoir sur chaque protéine différente un « site allostérique» mimant sa régulation génétique. Mais comme la régulation du nombre d’unités protéiques dans chaque réservoir est déterminée à la fois par des enzymes qui détruisent ces protéines (protéases) et d’autres qui les synthétisent (ribosomes) il faudrait prévoir, pour chaque protéine virtuelle une entrée particulière traduisant l’effet global de ces deux processus opposés, c'est-à-dire ayant un effet soit nul (quand la synthèse compense exactement la lyse), soit activateur (quand la première dépasse la seconde) soit inhibiteur (quand la synthèse cesse). Cet effet serait modulé par des informations spécifiques, équivalents des inducteurs et répresseurs des gênes réels. Ceci se traduirait par un coefficient agissant sur le nombre d’unités présentes dans le réservoir, c’et à dire sur une des entrées de chaque PV.

Le système virtuel présente en effet un gros avantage par rapport au système naturel. Il n’est pas nécessaire, pour comprendre l’auto-organisation du réseau de s’encombrer des mécanismes de synthèse des protéines à partir des gênes. On peut donc ignorer l’ADN. Ceci peut paraître paradoxal mais en réalité toute l’intelligence « active » de la cellule (celle que nous cherchons à mimer), tout le système qui « compute » ses relations avec l’environnement, est concentrée dans le réseau de ses protéines. L’information génétique n’est qu’une partie de l’information « agissante » de la protéine. La séquence des nucléotides de l’ADN ou de l’ARNm ne détermine que la structure primaire de la protéine, une structure qui n’a aucun pouvoir de calcul et donc de réflexion « intelligente ». Seule la protéine repliée possède ces capacités.

Il me semble donc judicieux, dans une simulation à visée pratique (mais pas dans une exploration théorique de la vie métabolique) de se libérer du lourd appareil génétique et de se concentrer uniquement sur le réseau protéique puisque c’est lui, en définitive, qui « réfléchit ».

De la grammaire à la conjugaison.

De même que nous avons repéré dans le réseau métabolique une série limitée de modules organisationnels de base, nous devrions commencer par étudier le comportement spontané de systèmes multiprotéiques simples en explorant l’espace de leurs comportements possibles. Nous ignorons très largement ce qui peut émerger de cohérent quand on associe (on « conjugue ») entre eux quelques modules élémentaires, en particulier dès qu’ils sont reliés par des boucles de rétroaction.

On pourrait ainsi développer une sorte de bibliothèque de systèmes dynamiques simples dont les propriétés émergentes seraient bien connues et les combiner de façon à générer des systèmes dynamiques réellement complexes et donc potentiellement capables de réfléchir des situations extérieures elles-mêmes complexes. La preuve de leur « compréhension » de ces situations serait la persistance de leur cohérence et de leur stabilité dynamique globale, c’est à dire leur souplesse adaptative, leur capacité à transiter entre de nombreux états dynamiques stables sans se désintégrer, c'est-à-dire s’arrêter de bouger.

Toutes ces considérations informatiques sont issues de mon esprit aucunement formé à cette science mais il me semble que les bases théoriques de cette intelligence cellulaire que je propose sont solides parce que directement issues de l’analyse du réseau métabolique de la cellule réelle et que rien n’empêche qu’elles soient matériellement mise en œuvre.