nwaku/waku/v2/node/peer_manager/peer_manager.nim

when (NimMajor, NimMinor) < (1, 4):
  {.push raises: [Defect].}
else:
  {.push raises: [].}


import
  std/[options, sets, sequtils, times, strutils],
  chronos,
  chronicles,
  metrics,
  libp2p/multistream
import
  ../../protocol/waku_relay,
  ../../utils/peers,
  ./peer_store/peer_storage,
  ./waku_peer_store

export waku_peer_store, peer_storage, peers

declareCounter waku_peers_dials, "Number of peer dials", ["outcome"]
# TODO: Populate from PeerStore.Source when ready
declarePublicCounter waku_node_conns_initiated, "Number of connections initiated", ["source"]
declarePublicGauge waku_peers_errors, "Number of peer manager errors", ["type"]
declarePublicGauge waku_connected_peers, "Number of connected peers per direction", ["direction"]
declarePublicGauge waku_peer_store_size, "Number of peers managed by the peer store"
declarePublicGauge waku_service_peers, "Service peer protocol and multiaddress ", labels = ["protocol", "peerId"]

logScope:
  topics = "waku node peer_manager"

const
  # TODO: Make configurable
  DefaultDialTimeout = chronos.seconds(10)

  # Max attempts before removing the peer
  MaxFailedAttempts = 5

  # Time to wait before attempting to dial again is calculated as:
  # initialBackoffInSec*(backoffFactor^(failedAttempts-1))
  # 120s, 480s, 1920, 7680s
  InitialBackoffInSec = 120
  BackoffFactor = 4

  # Limit the amount of paralel dials
  MaxParalelDials = 10

  # Delay between consecutive relayConnectivityLoop runs
  ConnectivityLoopInterval = chronos.seconds(15)

  # How often the peer store is pruned
  PrunePeerStoreInterval = chronos.minutes(5)

type
  PeerManager* = ref object of RootObj
    switch*: Switch
    peerStore*: PeerStore
    initialBackoffInSec*: int
    backoffFactor*: int
    maxFailedAttempts*: int
    storage: PeerStorage
    serviceSlots*: Table[string, RemotePeerInfo]
    started: bool

proc protocolMatcher*(codec: string): Matcher =
  ## Returns a protocol matcher function for the provided codec
  proc match(proto: string): bool {.gcsafe.} =
    ## Matches a proto with any postfix to the provided codec.
    ## E.g. if the codec is `/vac/waku/filter/2.0.0` it matches the protos:
    ## `/vac/waku/filter/2.0.0`, `/vac/waku/filter/2.0.0-beta3`, `/vac/waku/filter/2.0.0-actualnonsense`
    return proto.startsWith(codec)

  return match

####################
# Helper functions #
####################

proc insertOrReplace(ps: PeerStorage,
                     peerId: PeerID,
                     remotePeerInfo: RemotePeerInfo,
                     connectedness: Connectedness,
                     disconnectTime: int64 = 0) =
  # Insert peer entry into persistent storage, or replace existing entry with updated info
  let res = ps.put(peerId, remotePeerInfo, connectedness, disconnectTime)
  if res.isErr:
    warn "failed to store peers", err = res.error
    waku_peers_errors.inc(labelValues = ["storage_failure"])

proc addPeer*(pm: PeerManager, remotePeerInfo: RemotePeerInfo) =
  # Adds peer to manager for the specified protocol

  if remotePeerInfo.peerId == pm.switch.peerInfo.peerId:
    # Do not attempt to manage our unmanageable self
    return

  # ...public key
  var publicKey: PublicKey
  discard remotePeerInfo.peerId.extractPublicKey(publicKey)

  if pm.peerStore[AddressBook][remotePeerInfo.peerId] == remotePeerInfo.addrs and
     pm.peerStore[KeyBook][remotePeerInfo.peerId] == publicKey:
    # Peer already managed
    return

  trace "Adding peer to manager", peerId = remotePeerInfo.peerId, addresses = remotePeerInfo.addrs

  pm.peerStore[AddressBook][remotePeerInfo.peerId] = remotePeerInfo.addrs
  pm.peerStore[KeyBook][remotePeerInfo.peerId] = publicKey

  # Add peer to storage. Entry will subsequently be updated with connectedness information
  if not pm.storage.isNil:
    pm.storage.insertOrReplace(remotePeerInfo.peerId, pm.peerStore.get(remotePeerInfo.peerId), NotConnected)

# Connects to a given node. Note that this function uses `connect` and
# does not provide a protocol. Streams for relay (gossipsub) are created
# automatically without the needing to dial.
proc connectRelay*(pm: PeerManager,
                   peer: RemotePeerInfo,
                   dialTimeout = DefaultDialTimeout,
                   source = "api"): Future[bool] {.async.} =

  let peerId = peer.peerId

  # Do not attempt to dial self
  if peerId == pm.switch.peerInfo.peerId:
    return false

  if not pm.peerStore.hasPeer(peerId, WakuRelayCodec):
    pm.addPeer(peer)

  let failedAttempts = pm.peerStore[NumberFailedConnBook][peerId]
  debug "Connecting to relay peer", wireAddr=peer.addrs, peerId=peerId, failedAttempts=failedAttempts

  var deadline = sleepAsync(dialTimeout)
  var workfut = pm.switch.connect(peerId, peer.addrs)
  var reasonFailed = ""

  try:
    await workfut or deadline
    if workfut.finished():
      if not deadline.finished():
        deadline.cancel()
      waku_peers_dials.inc(labelValues = ["successful"])
      waku_node_conns_initiated.inc(labelValues = [source])
      pm.peerStore[NumberFailedConnBook][peerId] = 0
      return true
    else:
      reasonFailed = "timed out"
      await cancelAndWait(workfut)
  except CatchableError as exc:
    reasonFailed = "remote peer failed"

  # Dial failed
  pm.peerStore[NumberFailedConnBook][peerId] = pm.peerStore[NumberFailedConnBook][peerId] + 1
  pm.peerStore[LastFailedConnBook][peerId] = Moment.init(getTime().toUnix, Second)
  pm.peerStore[ConnectionBook][peerId] = CannotConnect

  debug "Connecting relay peer failed",
          peerId = peerId,
          reason = reasonFailed,
          failedAttempts = pm.peerStore[NumberFailedConnBook][peerId]
  waku_peers_dials.inc(labelValues = [reasonFailed])

  return false

# Dialing should be used for just protocols that require a stream to write and read
# This shall not be used to dial Relay protocols, since that would create
# unneccesary unused streams.
proc dialPeer(pm: PeerManager,
              peerId: PeerID,
              addrs: seq[MultiAddress],
              proto: string,
              dialTimeout = DefaultDialTimeout,
              source = "api"): Future[Option[Connection]] {.async.} =

  if peerId == pm.switch.peerInfo.peerId:
    error "could not dial self"
    return none(Connection)

  if proto == WakuRelayCodec:
    error "dial shall not be used to connect to relays"
    return none(Connection)

  debug "Dialing peer", wireAddr=addrs, peerId=peerId, proto=proto

  # Dial Peer
  let dialFut = pm.switch.dial(peerId, addrs, proto)
  var reasonFailed = ""
  try:
    if (await dialFut.withTimeout(dialTimeout)):
      return some(dialFut.read())
    else:
      reasonFailed = "timeout"
      await cancelAndWait(dialFut)
  except CatchableError as exc:
    reasonFailed = "failed"

  debug "Dialing peer failed", peerId=peerId, reason=reasonFailed, proto=proto

  return none(Connection)

proc loadFromStorage(pm: PeerManager) =
  debug "loading peers from storage"
  # Load peers from storage, if available
  proc onData(peerId: PeerID, remotePeerInfo: RemotePeerInfo, connectedness: Connectedness, disconnectTime: int64) =
    trace "loading peer", peerId=peerId, connectedness=connectedness

    if peerId == pm.switch.peerInfo.peerId:
      # Do not manage self
      return

    # nim-libp2p books
    pm.peerStore[AddressBook][peerId] = remotePeerInfo.addrs
    pm.peerStore[ProtoBook][peerId] = remotePeerInfo.protocols
    pm.peerStore[KeyBook][peerId] = remotePeerInfo.publicKey
    pm.peerStore[AgentBook][peerId] = remotePeerInfo.agent
    pm.peerStore[ProtoVersionBook][peerId] = remotePeerInfo.protoVersion

    # custom books
    pm.peerStore[ConnectionBook][peerId] = NotConnected  # Reset connectedness state
    pm.peerStore[DisconnectBook][peerId] = disconnectTime
    pm.peerStore[SourceBook][peerId] = remotePeerInfo.origin

  let res = pm.storage.getAll(onData)
  if res.isErr:
    warn "failed to load peers from storage", err = res.error
    waku_peers_errors.inc(labelValues = ["storage_load_failure"])
  else:
    debug "successfully queried peer storage"

##################
# Initialisation #
##################

# currently disabled. note that peer connection state connected/disconnected
# cant be tracked using this handler when more than one conn is allowed and
# when using autonat. eg if a peer has 2 conns and one is disconnected we cant
# assume that the peer is disconnected, because the other one might still be active.
# note that even with maxconn = 1, autonat forces more than one connection.
proc onConnEvent(pm: PeerManager, peerId: PeerID, event: ConnEvent) {.async.} =

  case event.kind
  of ConnEventKind.Connected:
    let direction = if event.incoming: Inbound else: Outbound
    discard
  of ConnEventKind.Disconnected:
    discard

proc onPeerEvent(pm: PeerManager, peerId: PeerId, event: PeerEvent) {.async.} =
  if event.kind == PeerEventKind.Joined:
    let direction = if event.initiator: Outbound else: Inbound
    pm.peerStore[ConnectionBook][peerId] = Connected
    pm.peerStore[DirectionBook][peerId] = direction
    waku_connected_peers.inc(1, labelValues=[$direction])

    if not pm.storage.isNil:
      pm.storage.insertOrReplace(peerId, pm.peerStore.get(peerId), Connected)
    return

  elif event.kind == PeerEventKind.Left:
    pm.peerStore[DirectionBook][peerId] = UnknownDirection
    pm.peerStore[ConnectionBook][peerId] = CanConnect
    waku_connected_peers.dec(1, labelValues=[$pm.peerStore[DirectionBook][peerId]])

    if not pm.storage.isNil:
      pm.storage.insertOrReplace(peerId, pm.peerStore.get(peerId), CanConnect, getTime().toUnix)
    return

proc new*(T: type PeerManager,
          switch: Switch,
          storage: PeerStorage = nil,
          initialBackoffInSec = InitialBackoffInSec,
          backoffFactor = BackoffFactor,
          maxFailedAttempts = MaxFailedAttempts,): PeerManager =

  let capacity = switch.peerStore.capacity
  let maxConnections = switch.connManager.inSema.size
  if maxConnections > capacity:
    error "Max number of connections can't be greater than PeerManager capacity",
         capacity = capacity,
         maxConnections = maxConnections
    raise newException(Defect, "Max number of connections can't be greater than PeerManager capacity")

  let pm = PeerManager(switch: switch,
                       peerStore: switch.peerStore,
                       storage: storage,
                       initialBackoffInSec: initialBackoffInSec,
                       backoffFactor: backoffFactor,
                       maxFailedAttempts: maxFailedAttempts)
  proc connHook(peerId: PeerID, event: ConnEvent): Future[void] {.gcsafe.} =
    onConnEvent(pm, peerId, event)

  proc peerHook(peerId: PeerId, event: PeerEvent): Future[void] {.gcsafe.} =
    onPeerEvent(pm, peerId, event)

  proc peerStoreChanged(peerId: PeerId) {.gcsafe.} =
    waku_peer_store_size.set(toSeq(pm.peerStore[AddressBook].book.keys).len.int64)

  # currently disabled
  #pm.switch.addConnEventHandler(connHook, ConnEventKind.Connected)
  #pm.switch.addConnEventHandler(connHook, ConnEventKind.Disconnected)

  pm.switch.addPeerEventHandler(peerHook, PeerEventKind.Joined)
  pm.switch.addPeerEventHandler(peerHook, PeerEventKind.Left)

  # called every time the peerstore is updated
  pm.peerStore[AddressBook].addHandler(peerStoreChanged)

  pm.serviceSlots = initTable[string, RemotePeerInfo]()

  if not storage.isNil():
    debug "found persistent peer storage"
    pm.loadFromStorage() # Load previously managed peers.
  else:
    debug "no peer storage found"

  return pm

#####################
# Manager interface #
#####################

proc addServicePeer*(pm: PeerManager, remotePeerInfo: RemotePeerInfo, proto: string) =
  # Do not add relay peers
  if proto == WakuRelayCodec:
    warn "Can't add relay peer to service peers slots"
    return

  info "Adding peer to service slots", peerId = remotePeerInfo.peerId, addr = remotePeerInfo.addrs[0], service = proto
  waku_service_peers.set(1, labelValues = [$proto, $remotePeerInfo.addrs[0]])

   # Set peer for service slot
  pm.serviceSlots[proto] = remotePeerInfo

  pm.addPeer(remotePeerInfo)

proc reconnectPeers*(pm: PeerManager,
                     proto: string,
                     backoff: chronos.Duration = chronos.seconds(0)) {.async.} =
  ## Reconnect to peers registered for this protocol. This will update connectedness.
  ## Especially useful to resume connections from persistent storage after a restart.

  debug "Reconnecting peers", proto=proto

  # Proto is not persisted, we need to iterate over all peers.
  for peerInfo in pm.peerStore.peers(protocolMatcher(proto)):
    # Check that the peer can be connected
    if peerInfo.connectedness == CannotConnect:
      debug "Not reconnecting to unreachable or non-existing peer", peerId=peerInfo.peerId
      continue

    # Respect optional backoff period where applicable.
    let
      # TODO: Add method to peerStore (eg isBackoffExpired())
      disconnectTime = Moment.init(peerInfo.disconnectTime, Second)  # Convert
      currentTime = Moment.init(getTime().toUnix, Second) # Current time comparable to persisted value
      backoffTime = disconnectTime + backoff - currentTime # Consider time elapsed since last disconnect

    trace "Respecting backoff", backoff=backoff, disconnectTime=disconnectTime, currentTime=currentTime, backoffTime=backoffTime

    # TODO: This blocks the whole function. Try to connect to another peer in the meantime.
    if backoffTime > ZeroDuration:
      debug "Backing off before reconnect...", peerId=peerInfo.peerId, backoffTime=backoffTime
      # We disconnected recently and still need to wait for a backoff period before connecting
      await sleepAsync(backoffTime)

    discard await pm.connectRelay(peerInfo)

####################
# Dialer interface #
####################

proc dialPeer*(pm: PeerManager,
               remotePeerInfo: RemotePeerInfo,
               proto: string,
               dialTimeout = DefaultDialTimeout,
               source = "api",
               ): Future[Option[Connection]] {.async.} =
  # Dial a given peer and add it to the list of known peers
  # TODO: check peer validity and score before continuing. Limit number of peers to be managed.

  # First add dialed peer info to peer store, if it does not exist yet..
  # TODO: nim libp2p peerstore already adds them
  if not pm.peerStore.hasPeer(remotePeerInfo.peerId, proto):
    trace "Adding newly dialed peer to manager", peerId= $remotePeerInfo.peerId, address= $remotePeerInfo.addrs[0], proto= proto
    pm.addPeer(remotePeerInfo)

  return await pm.dialPeer(remotePeerInfo.peerId,remotePeerInfo.addrs, proto, dialTimeout, source)

proc dialPeer*(pm: PeerManager,
               peerId: PeerID,
               proto: string,
               dialTimeout = DefaultDialTimeout,
               source = "api",
               ): Future[Option[Connection]] {.async.} =
  # Dial an existing peer by looking up it's existing addrs in the switch's peerStore
  # TODO: check peer validity and score before continuing. Limit number of peers to be managed.

  let addrs = pm.switch.peerStore[AddressBook][peerId]
  return await pm.dialPeer(peerId, addrs, proto, dialTimeout, source)

proc connectToNodes*(pm: PeerManager,
                     nodes: seq[string]|seq[RemotePeerInfo],
                     dialTimeout = DefaultDialTimeout,
                     source = "api") {.async.} =
  if nodes.len == 0:
    return

  info "Dialing multiple peers", numOfPeers = nodes.len

  var futConns: seq[Future[bool]]
  for node in nodes:
    let node = when node is string: parseRemotePeerInfo(node)
               else: node
    futConns.add(pm.connectRelay(node))

  await allFutures(futConns)
  let successfulConns = futConns.mapIt(it.read()).countIt(true)

  info "Finished dialing multiple peers", successfulConns=successfulConns, attempted=nodes.len

  # The issue seems to be around peers not being fully connected when
  # trying to subscribe. So what we do is sleep to guarantee nodes are
  # fully connected.
  #
  # This issue was known to Dmitiry on nim-libp2p and may be resolvable
  # later.
  await sleepAsync(chronos.seconds(5))

proc connectToRelayPeers*(pm: PeerManager) {.async.} =
  let maxConnections = pm.switch.connManager.inSema.size
  let numInPeers = pm.switch.connectedPeers(lpstream.Direction.In).len
  let numOutPeers = pm.switch.connectedPeers(lpstream.Direction.Out).len
  let numConPeers = numInPeers + numOutPeers

  # TODO: Enforce a given in/out peers ratio

  # Leave some room for service peers
  if numConPeers >= (maxConnections - 5):
    return

  # TODO: Track only relay connections (nwaku/issues/1566)
  let notConnectedPeers = pm.peerStore.getNotConnectedPeers().mapIt(RemotePeerInfo.init(it.peerId, it.addrs))
  let outsideBackoffPeers = notConnectedPeers.filterIt(pm.peerStore.canBeConnected(it.peerId,
                                                                                  pm.initialBackoffInSec,
                                                                                  pm.backoffFactor))
  let numPeersToConnect = min(min(maxConnections - numConPeers, outsideBackoffPeers.len), MaxParalelDials)

  info "Relay peer connections",
    connectedPeers = numConPeers,
    targetConnectedPeers = maxConnections,
    notConnectedPeers = notConnectedPeers.len,
    outsideBackoffPeers = outsideBackoffPeers.len

  await pm.connectToNodes(outsideBackoffPeers[0..<numPeersToConnect])

proc prunePeerStore*(pm: PeerManager) =
  let numPeers = toSeq(pm.peerStore[AddressBook].book.keys).len
  let capacity = pm.peerStore.capacity
  if numPeers < capacity:
    return

  debug "Peer store capacity exceeded", numPeers = numPeers, capacity = capacity
  let peersToPrune = numPeers - capacity

  # prune peers with too many failed attempts
  var pruned = 0
  # copy to avoid modifying the book while iterating
  let peerKeys = toSeq(pm.peerStore[NumberFailedConnBook].book.keys)
  for peerId in peerKeys:
    if peersToPrune - pruned == 0:
      break
    if pm.peerStore[NumberFailedConnBook][peerId] >= pm.maxFailedAttempts:
      pm.peerStore.del(peerId)
      pruned += 1

  # if we still need to prune, prune peers that are not connected
  let notConnected = pm.peerStore.getNotConnectedPeers().mapIt(it.peerId)
  for peerId in notConnected:
    if peersToPrune - pruned == 0:
      break
    pm.peerStore.del(peerId)
    pruned += 1

  let afterNumPeers = toSeq(pm.peerStore[AddressBook].book.keys).len
  debug "Finished pruning peer store", beforeNumPeers = numPeers,
                                       afterNumPeers = afterNumPeers,
                                       capacity = capacity,
                                       pruned = pruned

proc selectPeer*(pm: PeerManager, proto: string): Option[RemotePeerInfo] =
  debug "Selecting peer from peerstore", protocol=proto

  # Selects the best peer for a given protocol
  let peers = pm.peerStore.getPeersByProtocol(proto)

  # No criteria for selecting a peer for WakuRelay, random one
  if proto == WakuRelayCodec:
    # TODO: proper heuristic here that compares peer scores and selects "best" one. For now the first peer for the given protocol is returned
    if peers.len > 0:
      debug "Got peer from peerstore", peerId=peers[0].peerId, multi=peers[0].addrs[0], protocol=proto
      return some(peers[0])
    debug "No peer found for protocol", protocol=proto
    return none(RemotePeerInfo)

  # For other protocols, we select the peer that is slotted for the given protocol
  pm.serviceSlots.withValue(proto, serviceSlot):
    debug "Got peer from service slots", peerId=serviceSlot[].peerId, multi=serviceSlot[].addrs[0], protocol=proto
    return some(serviceSlot[])

  # If not slotted, we select a random peer for the given protocol
  if peers.len > 0:
    debug "Got peer from peerstore", peerId=peers[0].peerId, multi=peers[0].addrs[0], protocol=proto
    return some(peers[0])
  debug "No peer found for protocol", protocol=proto
  return none(RemotePeerInfo)

# Prunes peers from peerstore to remove old/stale ones
proc prunePeerStoreLoop(pm: PeerManager) {.async.}  =
  debug "Starting prune peerstore loop"
  while pm.started:
    pm.prunePeerStore()
    await sleepAsync(PrunePeerStoreInterval)

# Ensures a healthy amount of connected relay peers
proc relayConnectivityLoop*(pm: PeerManager) {.async.} =
  debug "Starting relay connectivity loop"
  while pm.started:
    await pm.connectToRelayPeers()
    await sleepAsync(ConnectivityLoopInterval)

proc start*(pm: PeerManager) =
  pm.started = true
  asyncSpawn pm.relayConnectivityLoop()
  asyncSpawn pm.prunePeerStoreLoop()

proc stop*(pm: PeerManager) =
  pm.started = false
-												refactor(peer_manager): move peer_store under peer_manager module


											
										
										
											2022-11-04 08:40:13 +00:00
+								when (NimMajor, NimMinor) < (1, 4):
 								  {.push raises: [Defect].}
 								else:
 								  {.push raises: [].}
-												Added basic peer manager (#364)

* Added basic peer manager
											
										
										
											2021-02-04 10:32:58 +00:00
 								import
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  std/[options, sets, sequtils, times, strutils],
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								  chronos,
 								  chronicles,
-												refactor(peer_manager): move peer_store under peer_manager module


											
										
										
											2022-11-04 08:40:13 +00:00
+								  metrics,
 								  libp2p/multistream
 								import
-												fix: clean and normalize module imports


											
										
										
											2023-03-06 16:19:06 +00:00
+								  ../../protocol/waku_relay,
-												refactor(peer_manager): move peer_store under peer_manager module


											
										
										
											2022-11-04 08:40:13 +00:00
+								  ../../utils/peers,
 								  ./peer_store/peer_storage,
 								  ./waku_peer_store
-												Added basic peer manager (#364)

* Added basic peer manager
											
										
										
											2021-02-04 10:32:58 +00:00
-												Update submodules: differentiate between local and remote `PeerInfo`  (#730)

* Update submodules

* Remove PeerInfo where necessary
											
										
										
											2021-10-06 12:29:08 +00:00
+								export waku_peer_store, peer_storage, peers
-												Feat/peer manager improvements (#367)

* Add managed peers to Admin API result

* Deal with dial failures
											
										
										
											2021-02-05 10:49:11 +00:00
 								declareCounter waku_peers_dials, "Number of peer dials", ["outcome"]
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								# TODO: Populate from PeerStore.Source when ready
-												feat: waku peer exchange (RFC34) (#1152)


											
										
										
											2022-09-20 11:03:34 +00:00
+								declarePublicCounter waku_node_conns_initiated, "Number of connections initiated", ["source"]
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								declarePublicGauge waku_peers_errors, "Number of peer manager errors", ["type"]
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								declarePublicGauge waku_connected_peers, "Number of connected peers per direction", ["direction"]
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								declarePublicGauge waku_peer_store_size, "Number of peers managed by the peer store"
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								declarePublicGauge waku_service_peers, "Service peer protocol and multiaddress ", labels = ["protocol", "peerId"]
-												refactor(peer_manager): move peer_store under peer_manager module


											
										
										
											2022-11-04 08:40:13 +00:00
-												Feat/peer manager improvements (#367)

* Add managed peers to Admin API result

* Deal with dial failures
											
										
										
											2021-02-05 10:49:11 +00:00
+								logScope:
-												chore: make log topics consistent with nim-chronicles style


											
										
										
											2022-11-03 15:36:24 +00:00
+								  topics = "waku node peer_manager"
-												Feat/peer manager improvements (#367)

* Add managed peers to Admin API result

* Deal with dial failures
											
										
										
											2021-02-05 10:49:11 +00:00
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								const
 								  # TODO: Make configurable
 								  DefaultDialTimeout = chronos.seconds(10)
-												Feat/peer manager improvements (#367)

* Add managed peers to Admin API result

* Deal with dial failures
											
										
										
											2021-02-05 10:49:11 +00:00
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								  # Max attempts before removing the peer
 								  MaxFailedAttempts = 5
 								  # Time to wait before attempting to dial again is calculated as:
 								  # initialBackoffInSec*(backoffFactor^(failedAttempts-1))
 								  # 120s, 480s, 1920, 7680s
 								  InitialBackoffInSec = 120
 								  BackoffFactor = 4
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								  # Limit the amount of paralel dials
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
+								  MaxParalelDials = 10
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								  # Delay between consecutive relayConnectivityLoop runs
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								  ConnectivityLoopInterval = chronos.seconds(15)
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								  # How often the peer store is pruned
 								  PrunePeerStoreInterval = chronos.minutes(5)
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								type
 								  PeerManager* = ref object of RootObj
 								    switch*: Switch
 								    peerStore*: PeerStore
 								    initialBackoffInSec*: int
 								    backoffFactor*: int
 								    maxFailedAttempts*: int
 								    storage: PeerStorage
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								    serviceSlots*: Table[string, RemotePeerInfo]
 								    started: bool
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								proc protocolMatcher*(codec: string): Matcher =
 								  ## Returns a protocol matcher function for the provided codec
 								  proc match(proto: string): bool {.gcsafe.} =
 								    ## Matches a proto with any postfix to the provided codec.
 								    ## E.g. if the codec is `/vac/waku/filter/2.0.0` it matches the protos:
 								    ## `/vac/waku/filter/2.0.0`, `/vac/waku/filter/2.0.0-beta3`, `/vac/waku/filter/2.0.0-actualnonsense`
 								    return proto.startsWith(codec)
 								  return match
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								####################
 								# Helper functions #
 								####################
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								proc insertOrReplace(ps: PeerStorage,
 								                     peerId: PeerID,
-												refactor(networking): unify peer data models, remove StoredInfo (#1597)


											
										
										
											2023-03-09 18:05:50 +00:00
+								                     remotePeerInfo: RemotePeerInfo,
-												Update submodules (#594)


											
										
										
											2021-06-09 14:37:08 +00:00
+								                     connectedness: Connectedness,
-												Refactor wakunode2.nim (#664)

* Refactor wakunode2.nim

* Remove empty raises

* Some formatting improvements
											
										
										
											2021-07-14 17:58:46 +00:00
+								                     disconnectTime: int64 = 0) =
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								  # Insert peer entry into persistent storage, or replace existing entry with updated info
-												refactor(networking): unify peer data models, remove StoredInfo (#1597)


											
										
										
											2023-03-09 18:05:50 +00:00
+								  let res = ps.put(peerId, remotePeerInfo, connectedness, disconnectTime)
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								  if res.isErr:
 								    warn "failed to store peers", err = res.error
 								    waku_peers_errors.inc(labelValues = ["storage_failure"])
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								proc addPeer*(pm: PeerManager, remotePeerInfo: RemotePeerInfo) =
 								  # Adds peer to manager for the specified protocol
 								  if remotePeerInfo.peerId == pm.switch.peerInfo.peerId:
 								    # Do not attempt to manage our unmanageable self
 								    return
 								  # ...public key
 								  var publicKey: PublicKey
 								  discard remotePeerInfo.peerId.extractPublicKey(publicKey)
 								  if pm.peerStore[AddressBook][remotePeerInfo.peerId] == remotePeerInfo.addrs and
 								     pm.peerStore[KeyBook][remotePeerInfo.peerId] == publicKey:
 								    # Peer already managed
 								    return
 								  trace "Adding peer to manager", peerId = remotePeerInfo.peerId, addresses = remotePeerInfo.addrs
 								  pm.peerStore[AddressBook][remotePeerInfo.peerId] = remotePeerInfo.addrs
 								  pm.peerStore[KeyBook][remotePeerInfo.peerId] = publicKey
 								  # Add peer to storage. Entry will subsequently be updated with connectedness information
 								  if not pm.storage.isNil:
 								    pm.storage.insertOrReplace(remotePeerInfo.peerId, pm.peerStore.get(remotePeerInfo.peerId), NotConnected)
 								# Connects to a given node. Note that this function uses `connect` and
 								# does not provide a protocol. Streams for relay (gossipsub) are created
 								# automatically without the needing to dial.
 								proc connectRelay*(pm: PeerManager,
 								                   peer: RemotePeerInfo,
 								                   dialTimeout = DefaultDialTimeout,
 								                   source = "api"): Future[bool] {.async.} =
 								  let peerId = peer.peerId
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
 								  # Do not attempt to dial self
 								  if peerId == pm.switch.peerInfo.peerId:
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								    return false
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  if not pm.peerStore.hasPeer(peerId, WakuRelayCodec):
 								    pm.addPeer(peer)
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  let failedAttempts = pm.peerStore[NumberFailedConnBook][peerId]
 								  debug "Connecting to relay peer", wireAddr=peer.addrs, peerId=peerId, failedAttempts=failedAttempts
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  var deadline = sleepAsync(dialTimeout)
 								  var workfut = pm.switch.connect(peerId, peer.addrs)
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								  var reasonFailed = ""
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								  try:
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								    await workfut or deadline
 								    if workfut.finished():
 								      if not deadline.finished():
 								        deadline.cancel()
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								      waku_peers_dials.inc(labelValues = ["successful"])
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								      waku_node_conns_initiated.inc(labelValues = [source])
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								      pm.peerStore[NumberFailedConnBook][peerId] = 0
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								      return true
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								    else:
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								      reasonFailed = "timed out"
 								      await cancelAndWait(workfut)
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								  except CatchableError as exc:
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								    reasonFailed = "remote peer failed"
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								  # Dial failed
 								  pm.peerStore[NumberFailedConnBook][peerId] = pm.peerStore[NumberFailedConnBook][peerId] + 1
 								  pm.peerStore[LastFailedConnBook][peerId] = Moment.init(getTime().toUnix, Second)
 								  pm.peerStore[ConnectionBook][peerId] = CannotConnect
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  debug "Connecting relay peer failed",
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								          peerId = peerId,
 								          reason = reasonFailed,
 								          failedAttempts = pm.peerStore[NumberFailedConnBook][peerId]
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								  waku_peers_dials.inc(labelValues = [reasonFailed])
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  return false
 								# Dialing should be used for just protocols that require a stream to write and read
 								# This shall not be used to dial Relay protocols, since that would create
 								# unneccesary unused streams.
 								proc dialPeer(pm: PeerManager,
 								              peerId: PeerID,
 								              addrs: seq[MultiAddress],
 								              proto: string,
 								              dialTimeout = DefaultDialTimeout,
 								              source = "api"): Future[Option[Connection]] {.async.} =
 								  if peerId == pm.switch.peerInfo.peerId:
 								    error "could not dial self"
 								    return none(Connection)
 								  if proto == WakuRelayCodec:
 								    error "dial shall not be used to connect to relays"
 								    return none(Connection)
 								  debug "Dialing peer", wireAddr=addrs, peerId=peerId, proto=proto
 								  # Dial Peer
 								  let dialFut = pm.switch.dial(peerId, addrs, proto)
 								  var reasonFailed = ""
 								  try:
 								    if (await dialFut.withTimeout(dialTimeout)):
 								      return some(dialFut.read())
 								    else:
 								      reasonFailed = "timeout"
 								      await cancelAndWait(dialFut)
 								  except CatchableError as exc:
 								    reasonFailed = "failed"
 								  debug "Dialing peer failed", peerId=peerId, reason=reasonFailed, proto=proto
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								  return none(Connection)
-												Refactor wakunode2.nim (#664)

* Refactor wakunode2.nim

* Remove empty raises

* Some formatting improvements
											
										
										
											2021-07-14 17:58:46 +00:00
+								proc loadFromStorage(pm: PeerManager) =
-												Patch v0.5.1 - fix multiple protocol IDs in persistent storage (#687)


											
										
										
											2021-07-27 06:48:56 +00:00
+								  debug "loading peers from storage"
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								  # Load peers from storage, if available
-												refactor(networking): unify peer data models, remove StoredInfo (#1597)


											
										
										
											2023-03-09 18:05:50 +00:00
+								  proc onData(peerId: PeerID, remotePeerInfo: RemotePeerInfo, connectedness: Connectedness, disconnectTime: int64) =
 								    trace "loading peer", peerId=peerId, connectedness=connectedness
-												Patch v0.5.1 - fix multiple protocol IDs in persistent storage (#687)


											
										
										
											2021-07-27 06:48:56 +00:00
-												Add backoff period before subscribing to persistent peers (#491)


											
										
										
											2021-04-16 09:57:45 +00:00
+								    if peerId == pm.switch.peerInfo.peerId:
 								      # Do not manage self
 								      return
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								    # nim-libp2p books
-												refactor(networking): unify peer data models, remove StoredInfo (#1597)


											
										
										
											2023-03-09 18:05:50 +00:00
+								    pm.peerStore[AddressBook][peerId] = remotePeerInfo.addrs
 								    pm.peerStore[ProtoBook][peerId] = remotePeerInfo.protocols
 								    pm.peerStore[KeyBook][peerId] = remotePeerInfo.publicKey
 								    pm.peerStore[AgentBook][peerId] = remotePeerInfo.agent
 								    pm.peerStore[ProtoVersionBook][peerId] = remotePeerInfo.protoVersion
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
 								    # custom books
 								    pm.peerStore[ConnectionBook][peerId] = NotConnected  # Reset connectedness state
 								    pm.peerStore[DisconnectBook][peerId] = disconnectTime
-												refactor(networking): unify peer data models, remove StoredInfo (#1597)


											
										
										
											2023-03-09 18:05:50 +00:00
+								    pm.peerStore[SourceBook][peerId] = remotePeerInfo.origin
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								  let res = pm.storage.getAll(onData)
 								  if res.isErr:
 								    warn "failed to load peers from storage", err = res.error
 								    waku_peers_errors.inc(labelValues = ["storage_load_failure"])
-												Patch v0.5.1 - fix multiple protocol IDs in persistent storage (#687)


											
										
										
											2021-07-27 06:48:56 +00:00
+								  else:
 								    debug "successfully queried peer storage"
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								##################
 								# Initialisation #
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								##################
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								# currently disabled. note that peer connection state connected/disconnected
 								# cant be tracked using this handler when more than one conn is allowed and
 								# when using autonat. eg if a peer has 2 conns and one is disconnected we cant
 								# assume that the peer is disconnected, because the other one might still be active.
 								# note that even with maxconn = 1, autonat forces more than one connection.
-												Feat/pm connection tracking (#377)

* Track connectedness state in peer manager
											
										
										
											2021-02-12 08:53:52 +00:00
+								proc onConnEvent(pm: PeerManager, peerId: PeerID, event: ConnEvent) {.async.} =
-												chore: reduce unnecessary logging (#991)


											
										
										
											2022-06-08 09:20:18 +00:00
-												Feat/pm connection tracking (#377)

* Track connectedness state in peer manager
											
										
										
											2021-02-12 08:53:52 +00:00
+								  case event.kind
 								  of ConnEventKind.Connected:
-												feat(peerstore): store peer direction (#1424)

* feat(peerstore): store peer direction

* feat(peerstore): add getPeersByDirection function + tests

* feat(peerstore): set out own MaxConnectionsPerPeer to 1

* feat(peermanager): add metric for inbound/outbound peers
											
										
										
											2022-11-29 16:35:25 +00:00
+								    let direction = if event.incoming: Inbound else: Outbound
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								    discard
 								  of ConnEventKind.Disconnected:
 								    discard
 								proc onPeerEvent(pm: PeerManager, peerId: PeerId, event: PeerEvent) {.async.} =
 								  if event.kind == PeerEventKind.Joined:
 								    let direction = if event.initiator: Outbound else: Inbound
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								    pm.peerStore[ConnectionBook][peerId] = Connected
-												feat(peerstore): store peer direction (#1424)

* feat(peerstore): store peer direction

* feat(peerstore): add getPeersByDirection function + tests

* feat(peerstore): set out own MaxConnectionsPerPeer to 1

* feat(peermanager): add metric for inbound/outbound peers
											
										
										
											2022-11-29 16:35:25 +00:00
+								    pm.peerStore[DirectionBook][peerId] = direction
 								    waku_connected_peers.inc(1, labelValues=[$direction])
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								    if not pm.storage.isNil:
 								      pm.storage.insertOrReplace(peerId, pm.peerStore.get(peerId), Connected)
-												Feat/pm connection tracking (#377)

* Track connectedness state in peer manager
											
										
										
											2021-02-12 08:53:52 +00:00
+								    return
-												feat(peerstore): store peer direction (#1424)

* feat(peerstore): store peer direction

* feat(peerstore): add getPeersByDirection function + tests

* feat(peerstore): set out own MaxConnectionsPerPeer to 1

* feat(peermanager): add metric for inbound/outbound peers
											
										
										
											2022-11-29 16:35:25 +00:00
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								  elif event.kind == PeerEventKind.Left:
-												feat(peerstore): store peer direction (#1424)

* feat(peerstore): store peer direction

* feat(peerstore): add getPeersByDirection function + tests

* feat(peerstore): set out own MaxConnectionsPerPeer to 1

* feat(peermanager): add metric for inbound/outbound peers
											
										
										
											2022-11-29 16:35:25 +00:00
+								    pm.peerStore[DirectionBook][peerId] = UnknownDirection
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								    pm.peerStore[ConnectionBook][peerId] = CanConnect
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								    waku_connected_peers.dec(1, labelValues=[$pm.peerStore[DirectionBook][peerId]])
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								    if not pm.storage.isNil:
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								      pm.storage.insertOrReplace(peerId, pm.peerStore.get(peerId), CanConnect, getTime().toUnix)
-												Feat/pm connection tracking (#377)

* Track connectedness state in peer manager
											
										
										
											2021-02-12 08:53:52 +00:00
+								    return
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								proc new*(T: type PeerManager,
 								          switch: Switch,
 								          storage: PeerStorage = nil,
 								          initialBackoffInSec = InitialBackoffInSec,
 								          backoffFactor = BackoffFactor,
 								          maxFailedAttempts = MaxFailedAttempts,): PeerManager =
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								  let capacity = switch.peerStore.capacity
 								  let maxConnections = switch.connManager.inSema.size
 								  if maxConnections > capacity:
 								    error "Max number of connections can't be greater than PeerManager capacity",
 								         capacity = capacity,
 								         maxConnections = maxConnections
 								    raise newException(Defect, "Max number of connections can't be greater than PeerManager capacity")
-												Feat/pm connection tracking (#377)

* Track connectedness state in peer manager
											
										
										
											2021-02-12 08:53:52 +00:00
+								  let pm = PeerManager(switch: switch,
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								                       peerStore: switch.peerStore,
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								                       storage: storage,
 								                       initialBackoffInSec: initialBackoffInSec,
 								                       backoffFactor: backoffFactor,
 								                       maxFailedAttempts: maxFailedAttempts)
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								  proc connHook(peerId: PeerID, event: ConnEvent): Future[void] {.gcsafe.} =
-												Update submodules: differentiate between local and remote `PeerInfo`  (#730)

* Update submodules

* Remove PeerInfo where necessary
											
										
										
											2021-10-06 12:29:08 +00:00
+								    onConnEvent(pm, peerId, event)
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								  proc peerHook(peerId: PeerId, event: PeerEvent): Future[void] {.gcsafe.} =
 								    onPeerEvent(pm, peerId, event)
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								  proc peerStoreChanged(peerId: PeerId) {.gcsafe.} =
 								    waku_peer_store_size.set(toSeq(pm.peerStore[AddressBook].book.keys).len.int64)
-												fix(networking): fix wrong peer connected state (#1560)


											
										
										
											2023-02-14 14:38:32 +00:00
+								  # currently disabled
 								  #pm.switch.addConnEventHandler(connHook, ConnEventKind.Connected)
 								  #pm.switch.addConnEventHandler(connHook, ConnEventKind.Disconnected)
 								  pm.switch.addPeerEventHandler(peerHook, PeerEventKind.Joined)
 								  pm.switch.addPeerEventHandler(peerHook, PeerEventKind.Left)
-												Feat/pm connection tracking (#377)

* Track connectedness state in peer manager
											
										
										
											2021-02-12 08:53:52 +00:00
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								  # called every time the peerstore is updated
 								  pm.peerStore[AddressBook].addHandler(peerStoreChanged)
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								  pm.serviceSlots = initTable[string, RemotePeerInfo]()
-												chore: make log topics consistent with nim-chronicles style


											
										
										
											2022-11-03 15:36:24 +00:00
+								  if not storage.isNil():
-												Patch v0.5.1 - fix multiple protocol IDs in persistent storage (#687)


											
										
										
											2021-07-27 06:48:56 +00:00
+								    debug "found persistent peer storage"
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								    pm.loadFromStorage() # Load previously managed peers.
-												Patch v0.5.1 - fix multiple protocol IDs in persistent storage (#687)


											
										
										
											2021-07-27 06:48:56 +00:00
+								  else:
 								    debug "no peer storage found"
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												Feat/pm connection tracking (#377)

* Track connectedness state in peer manager
											
										
										
											2021-02-12 08:53:52 +00:00
+								  return pm
-												Added basic peer manager (#364)

* Added basic peer manager
											
										
										
											2021-02-04 10:32:58 +00:00
-												Removed local peer sets for filter, swap and store (#375)


											
										
										
											2021-02-11 08:58:25 +00:00
+								#####################
 								# Manager interface #
 								#####################
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								proc addServicePeer*(pm: PeerManager, remotePeerInfo: RemotePeerInfo, proto: string) =
 								  # Do not add relay peers
 								  if proto == WakuRelayCodec:
 								    warn "Can't add relay peer to service peers slots"
 								    return
 								  info "Adding peer to service slots", peerId = remotePeerInfo.peerId, addr = remotePeerInfo.addrs[0], service = proto
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  waku_service_peers.set(1, labelValues = [$proto, $remotePeerInfo.addrs[0]])
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
 								   # Set peer for service slot
 								  pm.serviceSlots[proto] = remotePeerInfo
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  pm.addPeer(remotePeerInfo)
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
-												Patch v0.5.1 - fix multiple protocol IDs in persistent storage (#687)


											
										
										
											2021-07-27 06:48:56 +00:00
+								proc reconnectPeers*(pm: PeerManager,
 								                     proto: string,
 								                     backoff: chronos.Duration = chronos.seconds(0)) {.async.} =
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								  ## Reconnect to peers registered for this protocol. This will update connectedness.
 								  ## Especially useful to resume connections from persistent storage after a restart.
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
+								  debug "Reconnecting peers", proto=proto
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  # Proto is not persisted, we need to iterate over all peers.
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  for peerInfo in pm.peerStore.peers(protocolMatcher(proto)):
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								    # Check that the peer can be connected
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								    if peerInfo.connectedness == CannotConnect:
 								      debug "Not reconnecting to unreachable or non-existing peer", peerId=peerInfo.peerId
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								      continue
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								    # Respect optional backoff period where applicable.
 								    let
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								      # TODO: Add method to peerStore (eg isBackoffExpired())
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								      disconnectTime = Moment.init(peerInfo.disconnectTime, Second)  # Convert
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								      currentTime = Moment.init(getTime().toUnix, Second) # Current time comparable to persisted value
 								      backoffTime = disconnectTime + backoff - currentTime # Consider time elapsed since last disconnect
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								    trace "Respecting backoff", backoff=backoff, disconnectTime=disconnectTime, currentTime=currentTime, backoffTime=backoffTime
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
 								    # TODO: This blocks the whole function. Try to connect to another peer in the meantime.
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								    if backoffTime > ZeroDuration:
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								      debug "Backing off before reconnect...", peerId=peerInfo.peerId, backoffTime=backoffTime
-												Add persistent backoff for peers (#497)


											
										
										
											2021-04-21 09:36:56 +00:00
+								      # We disconnected recently and still need to wait for a backoff period before connecting
 								      await sleepAsync(backoffTime)
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								    discard await pm.connectRelay(peerInfo)
-												Integrate persistent peer storage (#437)

* Integrate persistent peer storage
											
										
										
											2021-03-26 08:49:51 +00:00
-												Peer manager: improvements; waku_filter integration (#368)

* Integrate peer manager with waku_filter

* Changelog and misc PR suggestions
											
										
										
											2021-02-08 09:17:20 +00:00
+								####################
 								# Dialer interface #
 								####################
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								proc dialPeer*(pm: PeerManager,
 								               remotePeerInfo: RemotePeerInfo,
 								               proto: string,
 								               dialTimeout = DefaultDialTimeout,
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								               source = "api",
 								               ): Future[Option[Connection]] {.async.} =
-												Peer manager: improvements; waku_filter integration (#368)

* Integrate peer manager with waku_filter

* Changelog and misc PR suggestions
											
										
										
											2021-02-08 09:17:20 +00:00
+								  # Dial a given peer and add it to the list of known peers
-												refactor(peer_manager): move peer_store under peer_manager module


											
										
										
											2022-11-04 08:40:13 +00:00
+								  # TODO: check peer validity and score before continuing. Limit number of peers to be managed.
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  # First add dialed peer info to peer store, if it does not exist yet..
 								  # TODO: nim libp2p peerstore already adds them
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
+								  if not pm.peerStore.hasPeer(remotePeerInfo.peerId, proto):
-												feat(wakunode2): support log format format selection


											
										
										
											2022-12-07 11:30:32 +00:00
+								    trace "Adding newly dialed peer to manager", peerId= $remotePeerInfo.peerId, address= $remotePeerInfo.addrs[0], proto= proto
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								    pm.addPeer(remotePeerInfo)
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								  return await pm.dialPeer(remotePeerInfo.peerId,remotePeerInfo.addrs, proto, dialTimeout, source)
-												Update submodules: differentiate between local and remote `PeerInfo`  (#730)

* Update submodules

* Remove PeerInfo where necessary
											
										
										
											2021-10-06 12:29:08 +00:00
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								proc dialPeer*(pm: PeerManager,
 								               peerId: PeerID,
 								               proto: string,
 								               dialTimeout = DefaultDialTimeout,
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								               source = "api",
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								               ): Future[Option[Connection]] {.async.} =
-												Update submodules: differentiate between local and remote `PeerInfo`  (#730)

* Update submodules

* Remove PeerInfo where necessary
											
										
										
											2021-10-06 12:29:08 +00:00
+								  # Dial an existing peer by looking up it's existing addrs in the switch's peerStore
-												refactor(peer_manager): move peer_store under peer_manager module


											
										
										
											2022-11-04 08:40:13 +00:00
+								  # TODO: check peer validity and score before continuing. Limit number of peers to be managed.
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												chore: update submodules (#987)


											
										
										
											2022-06-01 09:49:41 +00:00
+								  let addrs = pm.switch.peerStore[AddressBook][peerId]
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								  return await pm.dialPeer(peerId, addrs, proto, dialTimeout, source)
-												Update submodules: differentiate between local and remote `PeerInfo`  (#730)

* Update submodules

* Remove PeerInfo where necessary
											
										
										
											2021-10-06 12:29:08 +00:00
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								proc connectToNodes*(pm: PeerManager,
 								                     nodes: seq[string]|seq[RemotePeerInfo],
 								                     dialTimeout = DefaultDialTimeout,
 								                     source = "api") {.async.} =
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
+								  if nodes.len == 0:
 								    return
 								  info "Dialing multiple peers", numOfPeers = nodes.len
-												refactor: reuse nim-libp2p peerstore + move peermanager logic (#1383)

* refactor: reuse nim-libp2p peerstore + move peermanager logic

* refactor: fix comments

* refactor: modify reconnectPeers and unittest

* feat(apps): new flag for peerStoreCapacity

* fix(examples): fix example2 target

* refactor: fix comments
											
										
										
											2022-11-24 13:11:23 +00:00
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  var futConns: seq[Future[bool]]
-												chore(p2p): unify dialpeer functions (#1458)


											
										
										
											2022-12-14 15:04:11 +00:00
+								  for node in nodes:
 								    let node = when node is string: parseRemotePeerInfo(node)
 								               else: node
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								    futConns.add(pm.connectRelay(node))
-												refactor(networking): wait for all futures together in connectToNodes (#1471)

* refactor(networking): wait for all futures together in connectToNodes

* refactor(networking): await fix style
											
										
										
											2023-01-09 20:45:50 +00:00
 								  await allFutures(futConns)
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  let successfulConns = futConns.mapIt(it.read()).countIt(true)
-												feat(networking): add backoff period after failed dial (#1462)

* feat(networking): add exponential backoff when dialing relay peers

* feat(networking): fix tests

* revert withTimeout

* feat(networking): refactor tests

* feat(networking): improve logs + ping using switch

* feat(networking): fix backoff bug + fix tests

* feat(networking): fix comments
											
										
										
											2023-01-23 20:24:46 +00:00
 								  info "Finished dialing multiple peers", successfulConns=successfulConns, attempted=nodes.len
-												feat: waku peer exchange (RFC34) (#1152)


											
										
										
											2022-09-20 11:03:34 +00:00
 								  # The issue seems to be around peers not being fully connected when
 								  # trying to subscribe. So what we do is sleep to guarantee nodes are
 								  # fully connected.
 								  #
 								  # This issue was known to Dmitiry on nim-libp2p and may be resolvable
 								  # later.
 								  await sleepAsync(chronos.seconds(5))
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								proc connectToRelayPeers*(pm: PeerManager) {.async.} =
 								  let maxConnections = pm.switch.connManager.inSema.size
 								  let numInPeers = pm.switch.connectedPeers(lpstream.Direction.In).len
 								  let numOutPeers = pm.switch.connectedPeers(lpstream.Direction.Out).len
 								  let numConPeers = numInPeers + numOutPeers
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  # TODO: Enforce a given in/out peers ratio
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  # Leave some room for service peers
 								  if numConPeers >= (maxConnections - 5):
 								    return
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  # TODO: Track only relay connections (nwaku/issues/1566)
 								  let notConnectedPeers = pm.peerStore.getNotConnectedPeers().mapIt(RemotePeerInfo.init(it.peerId, it.addrs))
 								  let outsideBackoffPeers = notConnectedPeers.filterIt(pm.peerStore.canBeConnected(it.peerId,
 								                                                                                  pm.initialBackoffInSec,
 								                                                                                  pm.backoffFactor))
 								  let numPeersToConnect = min(min(maxConnections - numConPeers, outsideBackoffPeers.len), MaxParalelDials)
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								  info "Relay peer connections",
 								    connectedPeers = numConPeers,
 								    targetConnectedPeers = maxConnections,
 								    notConnectedPeers = notConnectedPeers.len,
 								    outsideBackoffPeers = outsideBackoffPeers.len
-												feat(networking): add relay connectivity loop (#1482)

* feat(networking): add relay connectivity loop

* Add unit tests

* feat(networking): fix comments

* Fix lnsd comments
											
										
										
											2023-01-18 14:17:56 +00:00
-												bug: connect instead dial relay peers (#1622)


											
										
										
											2023-03-28 11:29:48 +00:00
+								  await pm.connectToNodes(outsideBackoffPeers[0..<numPeersToConnect])
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								proc prunePeerStore*(pm: PeerManager) =
 								  let numPeers = toSeq(pm.peerStore[AddressBook].book.keys).len
 								  let capacity = pm.peerStore.capacity
 								  if numPeers < capacity:
 								    return
 								  debug "Peer store capacity exceeded", numPeers = numPeers, capacity = capacity
 								  let peersToPrune = numPeers - capacity
 								  # prune peers with too many failed attempts
 								  var pruned = 0
-												fix(networking): fix flaky peerstore test (#1554)


											
										
										
											2023-02-13 17:10:20 +00:00
+								  # copy to avoid modifying the book while iterating
 								  let peerKeys = toSeq(pm.peerStore[NumberFailedConnBook].book.keys)
 								  for peerId in peerKeys:
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								    if peersToPrune - pruned == 0:
 								      break
 								    if pm.peerStore[NumberFailedConnBook][peerId] >= pm.maxFailedAttempts:
 								      pm.peerStore.del(peerId)
 								      pruned += 1
 								  # if we still need to prune, prune peers that are not connected
 								  let notConnected = pm.peerStore.getNotConnectedPeers().mapIt(it.peerId)
 								  for peerId in notConnected:
 								    if peersToPrune - pruned == 0:
 								      break
 								    pm.peerStore.del(peerId)
 								    pruned += 1
 								  let afterNumPeers = toSeq(pm.peerStore[AddressBook].book.keys).len
 								  debug "Finished pruning peer store", beforeNumPeers = numPeers,
 								                                       afterNumPeers = afterNumPeers,
 								                                       capacity = capacity,
 								                                       pruned = pruned
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								proc selectPeer*(pm: PeerManager, proto: string): Option[RemotePeerInfo] =
 								  debug "Selecting peer from peerstore", protocol=proto
 								  # Selects the best peer for a given protocol
 								  let peers = pm.peerStore.getPeersByProtocol(proto)
 								  # No criteria for selecting a peer for WakuRelay, random one
 								  if proto == WakuRelayCodec:
 								    # TODO: proper heuristic here that compares peer scores and selects "best" one. For now the first peer for the given protocol is returned
 								    if peers.len > 0:
 								      debug "Got peer from peerstore", peerId=peers[0].peerId, multi=peers[0].addrs[0], protocol=proto
-												refactor(networking): unify peer data models, remove StoredInfo (#1597)


											
										
										
											2023-03-09 18:05:50 +00:00
+								      return some(peers[0])
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								    debug "No peer found for protocol", protocol=proto
 								    return none(RemotePeerInfo)
 								  # For other protocols, we select the peer that is slotted for the given protocol
 								  pm.serviceSlots.withValue(proto, serviceSlot):
 								    debug "Got peer from service slots", peerId=serviceSlot[].peerId, multi=serviceSlot[].addrs[0], protocol=proto
 								    return some(serviceSlot[])
 								  # If not slotted, we select a random peer for the given protocol
 								  if peers.len > 0:
 								    debug "Got peer from peerstore", peerId=peers[0].peerId, multi=peers[0].addrs[0], protocol=proto
-												refactor(networking): unify peer data models, remove StoredInfo (#1597)


											
										
										
											2023-03-09 18:05:50 +00:00
+								    return some(peers[0])
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								  debug "No peer found for protocol", protocol=proto
 								  return none(RemotePeerInfo)
-												refactor(networking): peermanager refactor and cleanups (#1539)

* refactor(networking): use addServicePeer where needed + add metrics
											
										
										
											2023-02-27 17:24:31 +00:00
+								# Prunes peers from peerstore to remove old/stale ones
 								proc prunePeerStoreLoop(pm: PeerManager) {.async.}  =
 								  debug "Starting prune peerstore loop"
 								  while pm.started:
 								    pm.prunePeerStore()
 								    await sleepAsync(PrunePeerStoreInterval)
 								# Ensures a healthy amount of connected relay peers
 								proc relayConnectivityLoop*(pm: PeerManager) {.async.} =
 								  debug "Starting relay connectivity loop"
 								  while pm.started:
 								    await pm.connectToRelayPeers()
 								    await sleepAsync(ConnectivityLoopInterval)
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
+								proc start*(pm: PeerManager) =
 								  pm.started = true
 								  asyncSpawn pm.relayConnectivityLoop()
-												feat(networking): prune peers from peerstore exceeding capacity (#1513)

* feat(networking): prune peers from peerstore

* chore: add comments

* feat(networking): fix comments

* Add tests
											
										
										
											2023-01-31 12:24:49 +00:00
+								  asyncSpawn pm.prunePeerStoreLoop()
-												feat(networking): add service slots to peer manager (#1473)


											
										
										
											2023-01-26 09:20:20 +00:00
 								proc stop*(pm: PeerManager) =
 								  pm.started = false