permserver.go 16 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371
  1. package server
  2. import (
  3. "context"
  4. "errors"
  5. "fmt"
  6. "net"
  7. "time"
  8. "perms-system-server/internal/consts"
  9. authHelper "perms-system-server/internal/logic/auth"
  10. pub "perms-system-server/internal/logic/pub"
  11. "perms-system-server/internal/middleware"
  12. userModel "perms-system-server/internal/model/user"
  13. "perms-system-server/internal/svc"
  14. "perms-system-server/pb"
  15. "github.com/golang-jwt/jwt/v4"
  16. "github.com/zeromicro/go-zero/core/limit"
  17. "github.com/zeromicro/go-zero/core/logx"
  18. "golang.org/x/crypto/bcrypt"
  19. "google.golang.org/grpc/codes"
  20. "google.golang.org/grpc/peer"
  21. "google.golang.org/grpc/status"
  22. )
  23. // unknownPeerBucket 当无法解析对端 IP 时共享的限流桶 key。
  24. // 生产环境 gRPC-over-TCP 必然有 peer.Addr,正常流量不会落到这里;此常量仅为 in-process/socket
  25. // 等边缘路径兜底,避免 M-7 审计指出的"按 p.Addr.String() 取完整 host:port 导致限流形同虚设"的
  26. // 随端口漂移问题。共享同一个 key 会放大 DoS 面(所有未知 peer 共用一个计数器),但在此类路径
  27. // 不走真实业务流量的前提下收益足够。
  28. const unknownPeerBucket = "unknown"
  29. // extractClientIP 从 gRPC context 中提取对端 IP。显式剥离端口号(M-7):gRPC 的 p.Addr.String()
  30. // 形如 "1.2.3.4:54321",端口每次连接都变,若直接作为限流 key 相当于没限流。
  31. // 解析失败返回 error,由上层按场景决定是 fail-close(RefreshToken 敏感路径)还是降级到 unknown 桶
  32. // (VerifyToken 契约层约束不允许返回 error)。
  33. func extractClientIP(ctx context.Context) (string, error) {
  34. p, ok := peer.FromContext(ctx)
  35. if !ok || p == nil || p.Addr == nil {
  36. return "", errors.New("peer not identifiable")
  37. }
  38. host, _, err := net.SplitHostPort(p.Addr.String())
  39. if err != nil || host == "" {
  40. return "", errors.New("peer address invalid")
  41. }
  42. return host, nil
  43. }
  44. // PermServer 权限管理系统 gRPC 服务实现,供接入产品的服务端调用。
  45. type PermServer struct {
  46. svcCtx *svc.ServiceContext
  47. pb.UnimplementedPermServiceServer
  48. }
  49. func NewPermServer(svcCtx *svc.ServiceContext) *PermServer {
  50. return &PermServer{svcCtx: svcCtx}
  51. }
  52. // SyncPermissions 同步权限声明。产品服务端通过 appKey/appSecret 认证后批量同步权限定义(新增/更新/禁用不在列表中的权限)。
  53. func (s *PermServer) SyncPermissions(ctx context.Context, req *pb.SyncPermissionsReq) (*pb.SyncPermissionsResp, error) {
  54. items := make([]pub.SyncPermItem, len(req.Perms))
  55. for i, p := range req.Perms {
  56. items[i] = pub.SyncPermItem{Code: p.Code, Name: p.Name, Remark: p.Remark}
  57. }
  58. result, err := pub.ExecuteSyncPerms(ctx, s.svcCtx, req.AppKey, req.AppSecret, items)
  59. if err != nil {
  60. if se, ok := err.(*pub.SyncPermsError); ok {
  61. // 审计 M-2:404 是 tx 内 LockByCodeTx 命中 sqlx.ErrNotFound(产品行被并发删除)
  62. // 的语义,先于 400/401 前的前置校验放行后才可能出现。接入方 SDK 对 NotFound 一般
  63. // 配置"按业务未命中处理/不重试",若在这里落到 default 分支被统一成 codes.Internal,
  64. // 接入方会把一次正常的"产品不存在"当作系统故障 page 值班,扭曲重试与告警语义。
  65. switch se.Code {
  66. case 400:
  67. return nil, status.Error(codes.InvalidArgument, se.Message)
  68. case 401:
  69. return nil, status.Error(codes.Unauthenticated, se.Message)
  70. case 403:
  71. return nil, status.Error(codes.PermissionDenied, se.Message)
  72. case 404:
  73. return nil, status.Error(codes.NotFound, se.Message)
  74. case 409:
  75. return nil, status.Error(codes.Aborted, se.Message)
  76. default:
  77. return nil, status.Error(codes.Internal, se.Message)
  78. }
  79. }
  80. return nil, status.Error(codes.Internal, "同步权限失败")
  81. }
  82. return &pb.SyncPermissionsResp{Added: result.Added, Updated: result.Updated, Disabled: result.Disabled}, nil
  83. }
  84. // Login 产品端登录。产品成员通过用户名密码 + productCode 登录,返回 JWT 令牌对及用户权限信息。受 IP 维度限流保护。
  85. func (s *PermServer) Login(ctx context.Context, req *pb.LoginReq) (*pb.LoginResp, error) {
  86. clientIP, ipErr := extractClientIP(ctx)
  87. if ipErr != nil {
  88. // 审计 M-7 的核心修复是"把 host:port 剥成 host,避免端口漂移让限流失效";
  89. // 生产环境 gRPC 必有 peer,这里走不到;in-process/单测等边缘路径回落到共享 unknown 桶,
  90. // 上层仍会继续执行用户名级的 UsernameLoginLimit,不会造成防护真空。
  91. clientIP = unknownPeerBucket
  92. }
  93. if s.svcCtx.GrpcLoginLimiter != nil {
  94. code, _ := s.svcCtx.GrpcLoginLimiter.Take(fmt.Sprintf("grpc:login:%s", clientIP))
  95. if code == limit.OverQuota {
  96. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  97. }
  98. }
  99. if req.ProductCode == "" {
  100. return nil, status.Error(codes.InvalidArgument, "productCode不能为空")
  101. }
  102. result, err := pub.ValidateProductLogin(ctx, s.svcCtx, req.Username, req.Password, req.ProductCode, clientIP)
  103. if err != nil {
  104. if le, ok := err.(*pub.LoginError); ok {
  105. switch le.Code {
  106. case 400:
  107. return nil, status.Error(codes.InvalidArgument, le.Message)
  108. case 401:
  109. return nil, status.Error(codes.Unauthenticated, le.Message)
  110. case 403:
  111. return nil, status.Error(codes.PermissionDenied, le.Message)
  112. case 429:
  113. return nil, status.Error(codes.ResourceExhausted, le.Message)
  114. }
  115. }
  116. return nil, status.Error(codes.Internal, "登录失败")
  117. }
  118. ud := result.UserDetails
  119. return &pb.LoginResp{
  120. AccessToken: result.AccessToken,
  121. RefreshToken: result.RefreshToken,
  122. Expires: time.Now().Unix() + s.svcCtx.Config.Auth.AccessExpire,
  123. UserId: ud.UserId,
  124. Username: ud.Username,
  125. Nickname: ud.Nickname,
  126. MemberType: ud.MemberType,
  127. Perms: ud.Perms,
  128. }, nil
  129. }
  130. // RefreshToken 刷新令牌。使用有效的 refreshToken 换取新的令牌对,同时原子 CAS 递增 tokenVersion
  131. // 使旧令牌即时失效(单会话轮转)。受 IP 维度限流保护,防止签名爆破和并发刷新被用于会话劫持。
  132. func (s *PermServer) RefreshToken(ctx context.Context, req *pb.RefreshTokenReq) (*pb.RefreshTokenResp, error) {
  133. clientIP, ipErr := extractClientIP(ctx)
  134. if ipErr != nil {
  135. // 和 Login 相同,IP 解析失败走共享 unknown 桶;后续 CAS(IncrementTokenVersionIfMatch)
  136. // 和 per-user TokenOpLimiter 仍然兜底 session 劫持路径。
  137. clientIP = unknownPeerBucket
  138. }
  139. if s.svcCtx.GrpcRefreshLimiter != nil {
  140. code, _ := s.svcCtx.GrpcRefreshLimiter.Take(fmt.Sprintf("grpc:refresh:%s", clientIP))
  141. if code == limit.OverQuota {
  142. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  143. }
  144. }
  145. claims, err := authHelper.ParseRefreshToken(req.RefreshToken, s.svcCtx.Config.Auth.RefreshSecret)
  146. if err != nil {
  147. return nil, status.Error(codes.Unauthenticated, "refreshToken无效或已过期")
  148. }
  149. productCode := claims.ProductCode
  150. if req.ProductCode != "" && req.ProductCode != productCode {
  151. return nil, status.Error(codes.InvalidArgument, "刷新令牌不允许切换产品")
  152. }
  153. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, claims.UserId, productCode)
  154. if err != nil {
  155. // 与"用户已删除"区分:基础设施短时不可用走 Unavailable,token 不作废让客户端重试
  156. // (见审计 M-1)。
  157. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  158. }
  159. if ud.Username == "" {
  160. return nil, status.Error(codes.Unauthenticated, "用户不存在或已被删除")
  161. }
  162. if ud.Status != consts.StatusEnabled {
  163. return nil, status.Error(codes.PermissionDenied, "账号已被冻结")
  164. }
  165. if productCode != "" && ud.ProductStatus != consts.StatusEnabled {
  166. return nil, status.Error(codes.PermissionDenied, "该产品已被禁用")
  167. }
  168. if productCode != "" && !ud.IsSuperAdmin && ud.MemberType == "" {
  169. return nil, status.Error(codes.PermissionDenied, "您已不是该产品的成员")
  170. }
  171. if claims.TokenVersion != ud.TokenVersion {
  172. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  173. }
  174. if s.svcCtx.TokenOpLimiter != nil {
  175. code, _ := s.svcCtx.TokenOpLimiter.Take(fmt.Sprintf("grpc-refresh-u:%d", claims.UserId))
  176. if code == limit.OverQuota {
  177. return nil, status.Error(codes.ResourceExhausted, "刷新操作过于频繁,请稍后再试")
  178. }
  179. }
  180. // 审计 M-3:CAS 推进 tokenVersion 和签新令牌必须全部成功才能响应客户端,否则会出现
  181. // tokenVersion 已+1 但客户端仍拿着旧 refreshToken → 下一次刷新必 401 被强制登出
  182. // 的"非预期登出"事件(会污染会话劫持告警)。改为"先试签 → 再 CAS":
  183. // (a) 拿 claims.TokenVersion+1 预试签发 access/refresh;签名若失败(HMAC 只有 OOM 等
  184. // 极端情况才会失败)直接 500,DB 状态完全不动。
  185. // (b) 两个 token 都成功后再做 IncrementTokenVersionIfMatch 做并发唯一赢家 CAS;CAS 失败走
  186. // 原来的 401/500 分支,客户端拿着的旧 refreshToken 仍然有效。
  187. // (c) CAS 赢家在返回前 Clean 缓存,保证 caller 下一次 Load 读到的是 DB 最新 tokenVersion。
  188. // 注意:由于 CAS 的新 version 一定等于 claims.TokenVersion + 1(见 IncrementTokenVersionIfMatch
  189. // 的 UPDATE 语义),这里直接按 claims.TokenVersion+1 预签即可,CAS 成功返回的 newVersion
  190. // 只用于 assert。
  191. predictedVersion := claims.TokenVersion + 1
  192. accessToken, err := authHelper.GenerateAccessToken(
  193. s.svcCtx.Config.Auth.AccessSecret, s.svcCtx.Config.Auth.AccessExpire,
  194. ud.UserId, ud.Username, ud.ProductCode, ud.MemberType, predictedVersion,
  195. )
  196. if err != nil {
  197. return nil, status.Error(codes.Internal, "生成token失败")
  198. }
  199. newRefreshToken, err := authHelper.GenerateRefreshTokenWithExpiry(
  200. s.svcCtx.Config.Auth.RefreshSecret,
  201. claims.ExpiresAt.Time,
  202. ud.UserId, ud.ProductCode, predictedVersion,
  203. )
  204. if err != nil {
  205. return nil, status.Error(codes.Internal, "生成token失败")
  206. }
  207. newVersion, err := s.svcCtx.SysUserModel.IncrementTokenVersionIfMatch(ctx, claims.UserId, ud.Username, claims.TokenVersion)
  208. if err != nil {
  209. if errors.Is(err, userModel.ErrTokenVersionMismatch) {
  210. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  211. }
  212. return nil, status.Error(codes.Internal, "刷新token失败")
  213. }
  214. if newVersion != predictedVersion {
  215. // 防御:CAS 成功时服务端约定 +1,实际不一致说明上游 SQL 实现漂移。告警后直接要求重登,
  216. // 保证客户端不会被发一个 tokenVersion 对不上的 token。
  217. logx.WithContext(ctx).Errorw("refresh token version prediction mismatch",
  218. logx.Field("audit", "refresh_token_version_mismatch"),
  219. logx.Field("userId", claims.UserId),
  220. logx.Field("claimed", claims.TokenVersion),
  221. logx.Field("predicted", predictedVersion),
  222. logx.Field("actual", newVersion),
  223. )
  224. return nil, status.Error(codes.Unauthenticated, "登录状态已失效,请重新登录")
  225. }
  226. s.svcCtx.UserDetailsLoader.Clean(ctx, claims.UserId)
  227. return &pb.RefreshTokenResp{
  228. AccessToken: accessToken,
  229. RefreshToken: newRefreshToken,
  230. Expires: time.Now().Unix() + s.svcCtx.Config.Auth.AccessExpire,
  231. }, nil
  232. }
  233. // VerifyToken 验证令牌。校验 accessToken 的有效性(签名、过期、用户状态、产品状态、成员资格、tokenVersion),
  234. // 有效时返回用户身份和权限信息。受 IP 维度限流保护,防止下游被攻破后把权限中心当作 token oracle 做爆破。
  235. //
  236. // 注意:本方法对外契约是"任何畸形/非法 token 都只返回 Valid=false,不返回 gRPC 错误"(见 fuzz 契约测试),
  237. // 因此 IP 解析失败时不能走 fail-close,改为降级到共享 "unknown" 限流桶——仍然有限速,但不破坏上游产品网关
  238. // 的稳定错误分类;真正过载时用 ResourceExhausted 响应。
  239. func (s *PermServer) VerifyToken(ctx context.Context, req *pb.VerifyTokenReq) (*pb.VerifyTokenResp, error) {
  240. clientIP, ipErr := extractClientIP(ctx)
  241. if ipErr != nil {
  242. clientIP = "unknown"
  243. }
  244. if s.svcCtx.GrpcVerifyLimiter != nil {
  245. code, _ := s.svcCtx.GrpcVerifyLimiter.Take(fmt.Sprintf("grpc:verify:%s", clientIP))
  246. if code == limit.OverQuota {
  247. return nil, status.Error(codes.ResourceExhausted, "请求过于频繁,请稍后再试")
  248. }
  249. }
  250. token, err := jwt.ParseWithClaims(req.AccessToken, &middleware.Claims{}, func(token *jwt.Token) (interface{}, error) {
  251. if _, ok := token.Method.(*jwt.SigningMethodHMAC); !ok {
  252. return nil, fmt.Errorf("unexpected signing method: %v", token.Header["alg"])
  253. }
  254. return []byte(s.svcCtx.Config.Auth.AccessSecret), nil
  255. })
  256. if err != nil || !token.Valid {
  257. logx.WithContext(ctx).Infof("verifyToken fail reason=invalid_token")
  258. return &pb.VerifyTokenResp{Valid: false}, nil
  259. }
  260. claims, ok := token.Claims.(*middleware.Claims)
  261. if !ok || claims.TokenType != consts.TokenTypeAccess {
  262. logx.WithContext(ctx).Infof("verifyToken fail reason=bad_claims")
  263. return &pb.VerifyTokenResp{Valid: false}, nil
  264. }
  265. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, claims.UserId, claims.ProductCode)
  266. if err != nil {
  267. // VerifyToken 的对外契约是"任何 token 问题只回 Valid=false,不抛 gRPC 错误"。但基础设施
  268. // 故障不属于"token 问题"——同化为 Valid=false 会让下游把合法用户踢出登录(见审计 M-1)。
  269. // 走 Unavailable,由下游按瞬时故障重试而不是据此清 token。
  270. logx.WithContext(ctx).Errorf("verifyToken: load user details failed: %v", err)
  271. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  272. }
  273. if ud.Username == "" {
  274. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=user_not_found", claims.UserId)
  275. return &pb.VerifyTokenResp{Valid: false}, nil
  276. }
  277. if ud.Status != consts.StatusEnabled {
  278. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=user_disabled", claims.UserId)
  279. return &pb.VerifyTokenResp{Valid: false}, nil
  280. }
  281. if claims.TokenVersion != ud.TokenVersion {
  282. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=token_version_mismatch", claims.UserId)
  283. return &pb.VerifyTokenResp{Valid: false}, nil
  284. }
  285. if claims.ProductCode != "" && ud.ProductStatus != consts.StatusEnabled {
  286. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=product_disabled product=%s", claims.UserId, claims.ProductCode)
  287. return &pb.VerifyTokenResp{Valid: false}, nil
  288. }
  289. if claims.ProductCode != "" && !ud.IsSuperAdmin && ud.MemberType == "" {
  290. logx.WithContext(ctx).Infof("verifyToken fail userId=%d reason=not_member product=%s", claims.UserId, claims.ProductCode)
  291. return &pb.VerifyTokenResp{Valid: false}, nil
  292. }
  293. return &pb.VerifyTokenResp{
  294. Valid: true,
  295. UserId: ud.UserId,
  296. Username: ud.Username,
  297. MemberType: ud.MemberType,
  298. Perms: ud.Perms,
  299. ProductCode: claims.ProductCode,
  300. }, nil
  301. }
  302. // GetUserPerms 查询用户权限。产品服务端通过 appKey/appSecret 认证后查询指定用户在该产品下的成员类型和权限列表,用于产品侧的权限网关判定。
  303. func (s *PermServer) GetUserPerms(ctx context.Context, req *pb.GetUserPermsReq) (*pb.GetUserPermsResp, error) {
  304. product, err := s.svcCtx.SysProductModel.FindOneByAppKey(ctx, req.AppKey)
  305. if err != nil {
  306. return nil, status.Error(codes.Unauthenticated, "无效的appKey")
  307. }
  308. if err := bcrypt.CompareHashAndPassword([]byte(product.AppSecret), []byte(req.AppSecret)); err != nil {
  309. return nil, status.Error(codes.Unauthenticated, "appSecret验证失败")
  310. }
  311. if product.Status != consts.StatusEnabled {
  312. return nil, status.Error(codes.PermissionDenied, "产品已被禁用")
  313. }
  314. if product.Code != req.ProductCode {
  315. return nil, status.Error(codes.InvalidArgument, "appKey与productCode不匹配")
  316. }
  317. ud, err := s.svcCtx.UserDetailsLoader.Load(ctx, req.UserId, req.ProductCode)
  318. if err != nil {
  319. return nil, status.Error(codes.Unavailable, "服务暂时不可用,请稍后重试")
  320. }
  321. if ud.Username == "" {
  322. return nil, status.Error(codes.NotFound, "用户不存在")
  323. }
  324. if ud.Status != consts.StatusEnabled {
  325. return nil, status.Error(codes.PermissionDenied, "用户已被冻结")
  326. }
  327. if !ud.IsSuperAdmin && ud.MemberType == "" {
  328. return nil, status.Error(codes.PermissionDenied, "用户不是该产品的有效成员")
  329. }
  330. return &pb.GetUserPermsResp{
  331. MemberType: ud.MemberType,
  332. Perms: ud.Perms,
  333. }, nil
  334. }